Oct, 2024

揭示大型视觉语言模型中的跨模态知识冲突

TL;DR本研究聚焦于大型视觉语言模型中的跨模态参数知识冲突问题,明确界定并系统性地检测与缓解此类冲突。通过提出动态对比解码方法,研究表明此方法能有效提高模型在多模态任务中的准确性,特别是在ViQuAE与InfoSeek数据集上,取得了2.24%的平均准确率提升。