Aug, 2024

使大型视觉语言模型成为优秀的少量学习者

TL;DR本研究解决了少量分类任务中大型视觉语言模型(LVLMs)在提取有用信息方面的不足,尤其是在学习特定响应格式和位置偏差问题。通过采用元学习策略和丰富的元任务构建,提升了模型提取少量支持数据的信息能力,实验结果表明该方法在多个数据集上表现优异,具有重要的实际应用潜力。