Jul, 2024

可靠的多模式医学视觉语言模型中的事实性规则

TL;DR基于外部知识的检索增强生成(RAG)方法,通过控制检索上下文数量和精心策划首选数据集来提高医学大规模视觉语言模型(Med-LVLMs)的事实准确性,并在三个医学VQA数据集上实现了平均20.8%的改进。