Jul, 2024
多模态大型语言模型在医学影像和自由文本报告数据挖掘中的潜力
Potential of Multimodal Large Language Models for Data Mining of Medical
Images and Free-text Reports
TL;DR通过对14个医学影像和放射学报告数据集进行综合评估,我们发现Gemini系列模型在报告生成和病灶检测方面表现出色,但在疾病分类和解剖学定位方面面临挑战;相反,GPT系列模型在病灶分割和解剖学定位方面表现出色,但在疾病诊断和病灶检测方面遇到困难。虽然这两种模型在减轻医生工作负担、缓解有限医疗资源压力以及促进临床从业者与人工智能技术之间的合作方面都有潜力,但在临床应用之前,还需要进行实质性的改进和全面的验证。