EMNLPOct, 2022

Clip-Tuning:一种基于多重奖励的无导数提示学习方法

TL;DR本文提出了一种名为 Clip-Tuning 的方法,利用预训练的语言模型来获得奖励的混合,并在少样本情况下超越了以前的基于梯度的对照方法。该方法采用了不同的冻结的预训练语言模型的精简网络,其推断预测反映了对提示培训样本的部分视图的集合。