Jun, 2024

可学习的上下文向量用于视觉问答

TL;DR学习型ICV(L-ICV)从示范中提取必要的任务信息,改善LMM中的ICL性能,通过与传统ICL和其他不可学习的ICV方法相比,实验结果显示L-ICV能够显著降低计算成本并提高VQA任务的准确性。