May, 2024

揭开大型视觉语言模型的一致性之纱

TL;DR通过多模态基准测试工具 ConBench,本研究首次揭示了大型视觉和语言模型在解决方案空间不同的提示下的答案一致性问题,并通过基于触发器的诊断优化方法,间接提高了模型的性能,以增强其描述能力。