Mar, 2024

MMIDR:通过知识蒸馏教授大型语言模型解读多模态误信息

TL;DR提出了 MMIDR 框架,用于教授大型语言模型在多模态错误信息检测中提供流畅、高质量的文本解释,通过数据增强和流程设计,将多模态错误信息转化为适当的指令遵循格式,再利用知识蒸馏方法将专有模型的解释能力传递给开源模型,实验证明 MMIDR 具有足够的检测性能,并能够提供有力的解释支持。