Feb, 2024

通过偏好微调来对齐视觉大型语言模型中的模态

TL;DR通过引入偏好调优和自动生成数据的方法 POVID,本研究解决了视觉大语言模型中可能出现的幻觉问题,并通过直接偏好优化的强化学习模型提高了模型性能。