May, 2024

2022 ACR-NCI-NVIDIA 联邦学习挑战中自动乳腺密度分类的公平评估结果

TL;DR乳房密度的正确解释对于评估乳腺癌风险很重要。利用人工智能准确预测乳房密度的能力已经得到证明,然而,由于乳房 X 光成像系统的特性差异,使用一个系统的数据构建的模型在其他系统上泛化能力不强。联邦学习已被提出作为一种提高人工智能泛化性能的方法,而无需共享数据,但在联邦学习中如何保留所有训练数据的特征仍然是一个活跃的研究领域。为了探索联邦学习方法,与美国放射学学会,哈佛医学院的 Mass General Brigham,科罗拉多大学,NVIDIA 和国立卫生研究院国家癌症研究所合作举办了乳房密度分类联邦学习挑战赛。挑战参与者可以提交能够在三个模拟的医疗机构上实现联邦学习的 docker 容器,每个机构都包含一个独特的大型乳房 X 光数据集。乳房密度联邦学习挑战赛从 2022 年 6 月 15 日持续到 9 月 5 日,吸引了来自世界各地的七个入围者。获胜的联邦学习解决方案在挑战测试数据上达到了线性 kappa 分数 0.653,并在外部测试数据集上达到了 0.413 的分数,与在一个中心位置训练的模型相当。