May, 2024

通过自我改进增强大型视觉语言模型中的视觉 - 语言模态对齐

TL;DR通过自我改进提高视觉与语言模态的对齐性的 SIMA 框架在 14 个幻觉和综合基准测试中展示了改进模型性能和优越的模态对齐,超过了先前的方法。