Feb, 2024
通过无分类器引导在大型视觉语言模型中减轻物体幻觉
Mitigating Object Hallucination in Large Vision-Language Models via Classifier-Free Guidance
Linxi Zhao, Yihe Deng, Weitong Zhang, Quanquan Gu
TL;DR通过 MARINE 框架,可以在生成过程中有效地减少大视觉 - 语言模型的假象,并提高生成细节,无需 teaining/fine-tuning 或 API 访问。