2022 ACR-NCI-NVIDIA 联邦学习挑战中自动乳腺密度分类的公平评估结果

May, 2024

2022 ACR-NCI-NVIDIA 联邦学习挑战中自动乳腺密度分类的公平评估结果

Fair Evaluation of Federated Learning Algorithms for Automated Breast Density Classification: The Results of the 2022 ACR-NCI-NVIDIA Federated Learning Challenge

PDF

Kendall Schmidt, Benjamin Bearce, Ken Chang, Laura Coombs, Keyvan Farahani...

TL;DR乳房密度的正确解释对于评估乳腺癌风险很重要。利用人工智能准确预测乳房密度的能力已经得到证明，然而，由于乳房 X 光成像系统的特性差异，使用一个系统的数据构建的模型在其他系统上泛化能力不强。联邦学习已被提出作为一种提高人工智能泛化性能的方法，而无需共享数据，但在联邦学习中如何保留所有训练数据的特征仍然是一个活跃的研究领域。为了探索联邦学习方法，与美国放射学学会，哈佛医学院的 Mass General Brigham，科罗拉多大学，NVIDIA 和国立卫生研究院国家癌症研究所合作举办了乳房密度分类联邦学习挑战赛。挑战参与者可以提交能够在三个模拟的医疗机构上实现联邦学习的 docker 容器，每个机构都包含一个独特的大型乳房 X 光数据集。乳房密度联邦学习挑战赛从 2022 年 6 月 15 日持续到 9 月 5 日，吸引了来自世界各地的七个入围者。获胜的联邦学习解决方案在挑战测试数据上达到了线性 kappa 分数 0.653，并在外部测试数据集上达到了 0.413 的分数，与在一个中心位置训练的模型相当。

Abstract

The correct interpretation of breast density is important in the assessment of breast cancer risk. ai has been shown capable of accurately

breast density ai federated learning mammography breast cancer risk

发现论文，激发创造

乳腺密度分类的联邦学习：一个实际实现

本文研究了在真实的合作环境下使用联邦学习（FL）构建医学成像分类模型。通过对世界各地的七个临床机构的数据进行联邦学习，成功地训练了乳腺密度分类模型，其性能比在机构的本地数据训练的模型平均提高了 6.3％，在其他机构的测试数据上表现出了 45.8％的相对改进。

Sep, 2020

MammoDL：使用联邦学习的乳腺 X 线密度估计

MammoDL 是一种开源软件工具，采用 U-Net 架构来准确估计乳腺密度和复杂性，通过 Open Federated Learning 在多个机构的数据集上实现了安全训练，与其他模型相比，该模型更轻便、更灵活，因为联邦学习使其在更大、更具代表性的数据集上训练，从而提高了泛化能力。

Jun, 2022

基于分布式联邦学习的隐私 MRI 脑瘤检测深度学习模型

本研究通过创新性地使用联邦学习方法，解决数据隐私和高效疾病诊断的双重挑战，以提高医学图像分类的准确性和效率，展示了联邦学习在磁共振成像（MRI）脑肿瘤检测中的应用效果，并强调了解决数据异质性的重要性和拓展联邦学习在医学图像分析中的研究方向。

Apr, 2024

CXR-FL: 基于深度学习的胸部 X 射线图像分析使用联邦学习

本篇论文提出并评估了一个名为 CXR-FL 的基于深度学习的联邦学习方法，用于医学影像分析，证明了联邦学习有助于保持模型的泛化能力以及深度学习模型对于肺部分割数据更为敏感，且其在分类方面的性能对于联邦学习的参数选择有一定程度的依赖。

Apr, 2022

把握差距：联邦学习拓宽诊断 AI 模型的领域泛化

通过评估训练策略、网络架构、泛化性能、图像发现、数据集大小和数据集多样性对 610,000 例胸部 X 光片的诊断表现进行了评估，并发现在培训数据量方面，本地训练具有更高的域内性能，而合作培训在域外任务方面更具优势。因此，联邦学习可以增强人工智能模型的诊断隐私、可重复性和域外可靠性，并潜在地优化医疗结果。

Oct, 2023

面向医学图像分类的不均衡和聚合数据分布联邦学习

采用新的真实数据分布，提出一种名为 FedIIC 的隐私保护框架，该框架通过类内对比学习和共享全局样本的类间对比学习进行特征提取器的校准来缓解训练造成的偏差，并使用考虑难度的逻辑调整构造 softmax 交叉熵损失以确保所有类别的平衡决策边界。在公共可用数据集上的实验表明，FedIIC 在处理两种耦合问题的同时，具有更优越的性能。

Jun, 2022

多模态联邦学习在非 IID 数据集上用于癌症分期与不平衡特征的研究

使用机器学习 (Machine Learning, ML) 和联邦学习 (Federated Learning, FL) 框架对医学影像进行癌症分期已引起了广泛的关注，并可以克服患者数据曝露的隐私问题。本文介绍了一种新颖的 FL 架构，可适应数据样本的异质性和基于机构的数据模态的不均匀性，通过分布式梯度融合和感知客户权重策略解决了跨多个数据模态的收敛速度差异挑战，并使用 The Cancer Genome Atlas 程序 (TCGA) 数据集进行实验证明方法的优越性。

Jan, 2024

皮肤病变分类的联邦主动学习框架

我们提出了一个联邦主动学习（FedAL）框架，通过在医学图像分析中周期性和交互式地执行主动学习，从而减少标注数据量、保护患者隐私，并保持联邦学习的性能。在真实的皮肤镜数据集上验证了我们的框架，在只使用 50％的样本的情况下，在皮肤病变分类任务上取得了与全数据联邦学习相媲美的性能。

Jun, 2024

医疗人工智能模型的非均匀标签协同训练

本论文提出了一种新的框架 —— 灵活的联邦学习（FFL），可用于协作训练医疗图像分析的大型、异质标记数据集，研究表明，使用 FFL 训练的模型优于仅使用匹配标记训练的模型。

Nov, 2022

隐私保护的医学影像联合学习与不确定性估计

机器学习和人工智能在医疗领域取得了显著进展，尤其在医学影像方面，机器学习模型有望改善疾病诊断、治疗计划和后期监测。联邦学习作为一个解决方案，允许组织通过共享模型训练信息（梯度）而非数据（如医学影像）来进行机器学习模型的合作训练，从而实现机构间的协作和保护患者隐私。然而，联邦学习仍面临一些挑战，本文对联邦学习、隐私保护和不确定性估计进行了综合评述，重点关注医学影像，同时指出了该领域的研究空白，并提出了未来联邦学习研究的方向，以增强隐私保护并解决医学影像数据中的噪声挑战。

Jun, 2024