医疗领域的数据缺口填补:生物医学数据分析中的迁移学习综述
本文探讨了用自然图像数据集(ImageNet)通过标准大型模型和预训练权重进行迁移学习在深度学习医学成像应用中的方法。然而,此方法在自然图像分类和目标医学任务之间存在根本差异,并且人们对迁移效果的了解甚少。该研究表明,在两项大规模医学成像任务的性能评估中,迁移学习对性能的提升有限,而简单轻量级模型可以与ImageNet架构相当。此外,还探讨了迁移的权重尺度的独立特性,并阐述了对更高效的模型探索的意义。
Feb, 2019
本研究对新近的使用ImageNet数据集进行卷积神经网络预训练之后在医学图像分析方面应用的文章进行了综述,总结了数据处理、方法选择和结果评估等方面的主要趋势,发现存在一些关键的研究缺口。
Apr, 2020
综合评估医疗机器学习的基准,提出一种基于医学信息志(MIMIC-III)的基准,让我们可以直接比较预测性能,并评估生存率、住院时间、表型和患者恶化任务的进展。我们发现,在这些任务上,尽管社区参与度高,但在过去的三年里,几乎没有真正显著的进展。通过我们的元分析,我们发现,深度递归模型的性能仅在某些任务上优于逻辑回归。最后综合这些结果,提出未来医学机器学习基准所需的理想特性。
Oct, 2020
通过对比自然图像与医学图像,本论文通过大规模评估了不同图像预训练模型在医学图像分析领域的可迁移性,提出了将自然图像模型迁移到医学图像中的实用方法,并发现新的关键性能:针对医学分割任务fine-grained数据预训练模型具有独特的局部特征表示,自我监督的ImageNet模型比有监督的ImageNet更有效地学习整体特征,连续预训练可以缩小自然图像与医学图像领域之间的跨度,有望引导深度学习在医学图像领域的未来研究。
Aug, 2021
介绍了一种名为“拼合学习”(Patchwork learning,PL)的新兴范式,通过整合来自不同数据模式的数据提供一个综合的方法来解决医疗保健中的数据隐私、异构数据来源以及无法完全利用多个数据模式的问题。PL允许同时利用互补的数据源,同时保持数据隐私,从而使得ML模型更全面和具有可推广性。该范式具有医疗数据集成更全面的方法,有望革新ML模型的临床适用性。
May, 2023
我们提出了一种迁移学习方法,通过限制异质领域中生成的特征的分布偏移,捕获与下游任务相关的域不变特征,从而培养出一个统一的域不变编码器,以达到更好的特征表示。在处理有限数据量时,我们提出的模型胜过竞争基线方法,并具有更高的训练收敛率,从而提供了更准确的对新兴大流行病和其他疾病的预测。
Oct, 2023
通过比较在医疗领域中的迁移学习与自监督学习的性能和鲁棒性,本文从相同的源域数据集采用不同的预训练方法分别预训练了两个模型,并在小规模医疗数据集上评估了它们,以识别影响其最终性能的因素。通过比较实验测试了医疗领域中的数据失衡、数据稀缺和数据领域不匹配等常见问题对特定的预训练模型的影响。最后,提供了帮助用户在医疗领域应用迁移学习和自监督学习方法,并构建更方便和高效的部署策略的建议。
Jul, 2024
该研究针对集中式机器学习在肿瘤学中存在的隐私问题和数据多样性利用不足的现状,系统评估了联邦学习在乳腺癌、肺癌和前列腺癌中的应用。研究发现,联邦学习在25项研究中有15项超越了集中式机器学习,显示其在临床设置中增强机器学习泛化性和保护数据隐私方面的有效性,对癌症研究具有重要的推动潜力。
Aug, 2024