Oct, 2022
语言感知的视觉与语言基础模型软提示
Language-Aware Soft Prompting for Vision & Language Foundation Models
TL;DR本文介绍了一种软提示学习的方法,用于Vision & Language模型。该方法通过使用第二交叉熵损失来最小化学习的软提示与手工工程提示之间的距离,进而提高模型性能,并能够训练虚拟类。在11个数据集上进行的广泛评估表明,该方法显著优于所有先前的软提示工作,并在大多数测试数据集上匹配和超越手工制作提示和CLIP的新类准确性。