Jun, 2024

可学习的上下文向量用于视觉问答

TL;DR学习型 ICV(L-ICV)从示范中提取必要的任务信息,改善 LMM 中的 ICL 性能,通过与传统 ICL 和其他不可学习的 ICV 方法相比,实验结果显示 L-ICV 能够显著降低计算成本并提高 VQA 任务的准确性。