医疗领域的数据缺口填补：生物医学数据分析中的迁移学习综述

Jul, 2024

医疗领域的数据缺口填补：生物医学数据分析中的迁移学习综述

Bridging Data Gaps in Healthcare: A Scoping Review of Transfer Learning in Biomedical Data Analysis

Siqi Li, Xin Li, Kunyu Yu, Di Miao, Mingcheng Zhu...

TL;DR通过挑选适当的源数据和模型、选择合适的迁移学习框架以及用适当的基线验证迁移学习模型，我们提倡在医疗研究中实现具有行动性的结构化医疗数据的迁移学习，解决地区差异、不平等和隐私约束问题。

Abstract

Clinical and biomedical research in low-resource settings often faces significant challenges due to the need for high-quality data with sufficient sample sizes to construct effective models. These constraints hin

发现论文，激发创造

医学影像迁移学习解析

本文探讨了用自然图像数据集（ImageNet）通过标准大型模型和预训练权重进行迁移学习在深度学习医学成像应用中的方法。然而，此方法在自然图像分类和目标医学任务之间存在根本差异，并且人们对迁移效果的了解甚少。该研究表明，在两项大规模医学成像任务的性能评估中，迁移学习对性能的提升有限，而简单轻量级模型可以与ImageNet架构相当。此外，还探讨了迁移的权重尺度的独立特性，并阐述了对更高效的模型探索的意义。

Feb, 2019

利用ImageNet的医学图像分析中的迁移学习研究

本研究对新近的使用ImageNet数据集进行卷积神经网络预训练之后在医学图像分析方面应用的文章进行了综述，总结了数据处理、方法选择和结果评估等方面的主要趋势，发现存在一些关键的研究缺口。

Apr, 2020

评估机器学习在纵向电子医疗数据上的进展

综合评估医疗机器学习的基准，提出一种基于医学信息志(MIMIC-III)的基准，让我们可以直接比较预测性能，并评估生存率、住院时间、表型和患者恶化任务的进展。我们发现，在这些任务上，尽管社区参与度高，但在过去的三年里，几乎没有真正显著的进展。通过我们的元分析，我们发现，深度递归模型的性能仅在某些任务上优于逻辑回归。最后综合这些结果，提出未来医学机器学习基准所需的理想特性。

Oct, 2020

医学图像分析的迁移学习系统基准测试分析

通过对比自然图像与医学图像，本论文通过大规模评估了不同图像预训练模型在医学图像分析领域的可迁移性，提出了将自然图像模型迁移到医学图像中的实用方法，并发现新的关键性能：针对医学分割任务fine-grained数据预训练模型具有独特的局部特征表示，自我监督的ImageNet模型比有监督的ImageNet更有效地学习整体特征，连续预训练可以缩小自然图像与医学图像领域之间的跨度，有望引导深度学习在医学图像领域的未来研究。

Aug, 2021

拼贴式学习：跨多样生物医学数据源集成分析范式

介绍了一种名为“拼合学习”(Patchwork learning，PL)的新兴范式，通过整合来自不同数据模式的数据提供一个综合的方法来解决医疗保健中的数据隐私、异构数据来源以及无法完全利用多个数据模式的问题。PL允许同时利用互补的数据源，同时保持数据隐私，从而使得ML模型更全面和具有可推广性。该范式具有医疗数据集成更全面的方法，有望革新ML模型的临床适用性。

May, 2023

迁移性指标的表现在医学任务中不可靠

通过对三个医学应用进行深入评估，我们的研究表明没有任何可靠和一致的迁移性评分能够准确估计医学环境下的目标性能，这为进一步研究指明了方向。

Aug, 2023

基于迁移学习的跨EMR数据集数据分布转移修复方法预测模型

我们提出了一种迁移学习方法，通过限制异质领域中生成的特征的分布偏移，捕获与下游任务相关的域不变特征，从而培养出一个统一的域不变编码器，以达到更好的特征表示。在处理有限数据量时，我们提出的模型胜过竞争基线方法，并具有更高的训练收敛率，从而提供了更准确的对新兴大流行病和其他疾病的预测。

Oct, 2023

MRI数据处理的机器学习技术在不断扩展的规模下的应用

医学扫描数据、大规模研究、机器学习训练、分布转变和表征学习是本研究论文的主要关键词和主题。

Apr, 2024

迁移学习与自监督学习的实验比较

通过比较在医疗领域中的迁移学习与自监督学习的性能和鲁棒性，本文从相同的源域数据集采用不同的预训练方法分别预训练了两个模型，并在小规模医疗数据集上评估了它们，以识别影响其最终性能的因素。通过比较实验测试了医疗领域中的数据失衡、数据稀缺和数据领域不匹配等常见问题对特定的预训练模型的影响。最后，提供了帮助用户在医疗领域应用迁移学习和自监督学习方法，并构建更方便和高效的部署策略的建议。

Jul, 2024

利用联邦学习推进肿瘤学：突破乳腺癌、肺癌和前列腺癌的界限。系统评价

该研究针对集中式机器学习在肿瘤学中存在的隐私问题和数据多样性利用不足的现状，系统评估了联邦学习在乳腺癌、肺癌和前列腺癌中的应用。研究发现，联邦学习在25项研究中有15项超越了集中式机器学习，显示其在临床设置中增强机器学习泛化性和保护数据隐私方面的有效性，对癌症研究具有重要的推动潜力。

Aug, 2024