BriefGPT.xyz
Ask
alpha
关键词
detailed vision annotations
搜索结果 - 1
用视觉监督减轻视觉 - 语言模型中的虚构问题
通过引入更详细的视觉注释和更具区分性的视觉模型来提高大型视觉语言模型的训练,使其能够生成更精确的回答,减少幻觉;此外,提出了新的评估基准 RAH-Bench 分为三种不同的幻觉类型,与原始 LLaVA 相比,我们的方法在该基准下实现了 +8
→
PDF
7 months ago
Prev
Next