Apr, 2024

MedThink:通过多模态决策理由解释医学视觉问题回答

TL;DR通过设计半自动注释过程,构建了基于多模态大型语言模型生成中间医疗决策理由的新的基准 MedVQA 数据集 R-RAD 和 R-SLAKE,并将其纳入训练过程中,通过三种不同的策略生成决策结果和相应的理由,从而清楚地展示推理过程中的医疗决策过程,实验证明该方法在 R-RAD 上能达到 83.5% 的准确率,在 R-SLAKE 上能达到 86.3% 的准确率,显著优于现有最先进的基线模型。