Apr, 2025

基于归纳符合预测的大型视觉语言模型预测集的数据驱动标定

TL;DR本研究针对大型视觉语言模型在视觉问答任务中出现的虚假内容问题,提出了一种基于分割符合预测框架的方法,以减轻这些模型的幻觉现象。通过动态阈值标定和跨模态一致性验证,该框架在用户定义的风险水平下构建具有统计保证的预测集,实现了理论可靠性与实际应用的结合,具备在医疗、自动化系统等安全关键领域中的实际应用潜力。