MMDec, 2023

通过对标题重写的方式,利用大型视觉语言模型进行微调来减轻细粒度的幻觉

TL;DR本文介绍了 ReCaption, 一个用于减少视觉 - 语言模型中细粒度物体幻觉的框架,并通过实验证明其有效性。