Mar, 2025

针对多模态大型语言模型评估的新型眼科基准:使用视网膜照片和光学相干断层扫描图像

TL;DR本研究解决了现有多模态大型语言模型(MMLMs)基准在眼科应用中无法有效捕捉临床复杂性的问题,特别是在光学相干断层扫描(OCT)图像分析方面。通过构建一个经过严格质量控制且具有专家标注的数据集,研究评估了七种主流MMLMs的诊断准确性,发现它们在不同疾病上的表现存在显著差异,强调了发展临床相关基准的重要性,以提升这些模型在眼科诊断和治疗中的转化潜力。