医疗人工智能中的泛化问题:发展可扩展模型的视角
本研究基于多中心临床时间序列和医学影像数据,评估了 8 种领域泛化方法在现实世界医学成像数据上的性能,并对真实性产生的领域偏差和采样偏差而进行模拟压力测试,发现当前领域泛化方法在现实世界医学成像数据上的表现并不总是能够显著提升。然而,在临床时间序列数据的某些真实性突出情景下,这些领域泛化方法确实会呈现出一定的性能提升,建议在临床环境中采用最佳实践方法来进行领域泛化。
Mar, 2021
本文通过探究机器学习中三种主流学习方法,即领域 / 任务特殊化学习,联合学习,以及连续学习,并运用 VLMs 这一良好的跨领域学习模型作为医学基础模型,得到了在不同领域 / 任务测试集中的十分出色的泛化性能,并提出连续学习可能是构建医学基础模型的一种切实可行和高效的学习范式。
Mar, 2023
医学图像分析(MedIA)作为计算机辅助诊断系统中的关键工具,近年来随着深度学习(DL)的进步而崭露头角。然而,当训练良好的深度模型在不同的医学站点、模态和序列上部署时往往会遇到显著的性能下降,即域偏移问题。针对这一问题,医学图像域泛化(DG)旨在通过在未知数据分布中有效泛化和鲁棒地执行,解决域偏移挑战。本文对该领域的重要发展进行了综述,包括对域偏移和医学领域域泛化的正式定义以及几个相关设置的讨论。随后,我们从数据操作、特征表示和模型训练三个角度总结了最近的方法,并详细介绍了每个角度的一些算法。此外,我们介绍了常用的数据集。最后,我们总结了现有文献,并提出了一些未来的潜在研究课题。为了支持此次调研,我们还创建了一个 GitHub 项目,收集了相关资源,链接为:https://this-URL-github-project
Feb, 2024
医学图像分析(MedIA)是医学和医疗中不可或缺的工具,对疾病诊断、预测和治疗计划有所助益,深度学习(DL)取得的重大成就对其发展作出了显著贡献。然而,用于 MedIA 的 DL 模型在实际情况中仍然具有挑战性,在训练和测试样本之间的分布差异下无法进行泛化,也即所谓的分布偏移问题。本文综述了专门针对 MedIA 的领域泛化研究,全面地回顾了领域泛化技术在更广泛的 MedIA 系统中的相互作用,超越方法论,考虑到对整个 MedIA 工作流程的操作影响。具体而言,我们将领域泛化方法分为数据级、特征级、模型级和分析级方法。我们展示了这些方法如何在 MedIA 工作流程的不同阶段中使用,从数据获取到模型预测和分析。此外,我们还包括了用于评估这些方法的基准数据集和应用,并分析了各种方法的优缺点,揭示了未来的研究机会。
Oct, 2023
近年来,我们不断发展了大量用于医学图像分析的深度学习模型,但仍然存在诸多挑战,如模型泛化性能、性能下降原因和如何克服性能下降等。本研究回顾了基于深度学习的分类模型的泛化方法,并讨论了未来的挑战,包括改进评估协议和基准以及实现稳健、泛化的医学图像分类模型的未来发展。
Mar, 2024
近期,人工智能算法在从临床照片中分类皮肤病方面取得了巨大进展。然而,我们对这些算法在现实环境下的鲁棒性了解甚少,而很多因素可能导致其普适性的丧失。通过理解和克服这些限制,我们可以开发出可以帮助在各种临床环境下诊断皮肤病的具有普适性的人工智能。在这项回顾性研究中,我们证明皮肤病分布的差异是人工智能算法在对来自先前未知来源的数据进行评估时产生错误的主要原因,与人口统计或图像捕捉模式无关。我们展示了一系列步骤来弥合这种普适性差距,需要越来越多关于新数据源的信息,从病症分布到以在训练期间较少接触到的数据为重点的训练数据。我们的研究结果还表明,与仅冻结嵌入模型的分类层进行微调相比,端到端微调的性能相当。根据所掌握的信息和资源,我们的方法可以为人工智能算法在新环境中的应用提供指导。
Feb, 2024
利用临床数据训练的大型语言模型在医疗保健领域提供了优化患者护理、临床决策和工作流程的新机会,然而其潜力主要取决于其在不同临床环境和患者群体中有效泛化的能力,这是一个常常被低估的挑战。本研究评估了一种在 [HOSPITAL] 的临床病历上训练的语言模型的性能,并发现其在少样本的医院、政府和未指定保险的患者、老年人以及多重共病者中的泛化能力较差。通过统计和分类分析,我们发现样本大小、患者年龄、共病程度和病历内容的字数都与泛化能力相关。最后,我们比较了三种方法以提高泛化能力:本地微调(针对特定医院)、实例化增强微调、和基于聚类的微调。结果表明,本地微调是最有效的方法,可以使 AUC 提高 0.25% 到 11.74%(在数据有限的情况下效果最好)。总体来说,本研究为在医疗保健这一重要领域部署大型语言模型提供了新的见解,并改进了它们在更广泛人群中的性能。
Feb, 2024
通过评估训练策略、网络架构、泛化性能、图像发现、数据集大小和数据集多样性对 610,000 例胸部 X 光片的诊断表现进行了评估,并发现在培训数据量方面,本地训练具有更高的域内性能,而合作培训在域外任务方面更具优势。因此,联邦学习可以增强人工智能模型的诊断隐私、可重复性和域外可靠性,并潜在地优化医疗结果。
Oct, 2023
当前医学图像分析的机器学习方法主要集中在为特定任务开发定制模型,利用其目标域内的数据。最近,提出了基础模型,它结合了来自各种领域的数据,并展现出出色的泛化能力。本研究在此基础上引入了多领域医学图像的结合,包括不同的成像方式如 X 线、MRI、CT 和超声图像,以及各种视角如轴位、冠状位和矢状位。我们称之为多领域模型,并将其性能与特定模型进行了对比。研究结果强调了多领域模型在数据有限和常遇到的超出分布情况下的优越泛化能力,尤其在医疗应用中。多样数据的整合使多领域模型能够利用跨领域的共享信息,显著提高整体结果。举例而言,在器官识别方面,与传统专用模型相比,多领域模型的准确性可以提高 10%。
Oct, 2023
本篇论文介绍了医学领域中解释性人工智能的研究,强调让人们能够透明地理解和信任 AI/ML 技术的重要性,主要关注于图像、* 组学数据和文本三个方面。
Dec, 2017