Oct, 2024

双原型演变用于视觉语言模型的测试时泛化

TL;DR本研究解决了现有视觉语言模型在测试时间适应中无法有效积累任务特定知识的问题。提出的双原型演变(DPE)方法采用文本和视觉原型,促进多模态表示的精准捕捉。实验结果表明,DPE在15个基准数据集上优于现有最先进的方法,并具有良好的计算效率。