May, 2024

揭开大型视觉语言模型的一致性之纱

TL;DR通过多模态基准测试工具ConBench,本研究首次揭示了大型视觉和语言模型在解决方案空间不同的提示下的答案一致性问题,并通过基于触发器的诊断优化方法,间接提高了模型的性能,以增强其描述能力。