ICCVJul, 2023

为何视觉 - 语言模型的提示调整对噪声标签具有鲁棒性?

TL;DR视觉语言模型通过大规模训练数据学习了一种通用的文本 - 图像嵌入。通过少量样本的提示调整,可以将视觉语言模型适应到新的分类任务中。我们发现,这种提示调整过程对标签噪声非常稳健,且具有鲁棒性。