Sep, 2023

使用事实增强的 RLHF 对齐大型多模型

TL;DR通过使用加强学习从人类反馈中获取的方法,我们提出了基于事实增强的视觉语言对齐算法,以解决大多模态模型中的模态不匹配问题,并在实际场景中取得了显著的改进。