Apr, 2025

多模态知识驱动的检索增强生成框架 MMKB-RAG

TL;DR本文解决了大型语言模型在生成最新信息时的局限性和信息准确性风险。我们提出了一种新颖的多模态检索增强生成框架 MMKB-RAG,通过动态生成语义标签优化检索过程,只保留最相关和准确的参考文献。实验结果表明,该方法在视觉问答任务上显著提升了性能,展示了较现有技术显著提高的准确性和鲁棒性。