Sep, 2024

医疗困惑:你能信任你的人工智能放射科医生吗?探究多模态医学基础模型的可靠性

TL;DR本研究针对多模态大型语言模型(MLLMs)在医疗领域的可靠性问题,揭示了现有医学基准未能有效识别的模型失效模式。通过引入MediConfusion数据集,我们发现现有模型在处理医学图像对时,表现不及随机猜测,这表明这些模型在医疗部署中的可靠性问题亟待解决。