Apr, 2024
MedThink:通过多模态决策理由解释医学视觉问题回答
MedThink: Explaining Medical Visual Question Answering via Multimodal
Decision-Making Rationale
TL;DR通过设计半自动注释过程,构建了基于多模态大型语言模型生成中间医疗决策理由的新的基准MedVQA数据集R-RAD和R-SLAKE,并将其纳入训练过程中,通过三种不同的策略生成决策结果和相应的理由,从而清楚地展示推理过程中的医疗决策过程,实验证明该方法在R-RAD上能达到83.5%的准确率,在R-SLAKE上能达到86.3%的准确率,显著优于现有最先进的基线模型。