医疗系统规模下的计算病理学 -- 来自三十亿图像的自监督基础模型

Oct, 2023

医疗系统规模下的计算病理学 -- 来自三十亿图像的自监督基础模型

Computational Pathology at Health System Scale -- Self-Supervised Foundation Models from Three Billion Images

Gabriele Campanella, Ricky Kwan, Eugene Fluder, Jennifer Zeng, Aryeh Stock...

TL;DR最近在自我监督学习方面的突破已经实现了使用大规模无标签数据集来训练视觉基础模型，该模型可以推广到各种下游任务。本项目的目标是训练最大的学术基础模型，并通过在大型临床病理数据集上的预训练和下游性能评估来对最重要的自我监督学习算法进行基准测试。结果表明，与自然图像的预训练相比，病理数据的预训练对下游性能是有益的。此外，DINO算法在所有测试任务中实现了更好的泛化性能。这些结果标志着计算病理学研究的一个阶段性变化，为基于大规模、并行预训练的更高性能模型开辟了新时代。

Abstract

Recent breakthroughs in self-supervised learning have enabled the use of large unlabeled datasets to train visual foundation models that can generalize to a variety of downstream tasks. While this training paradigm is well suited for the →

发现论文，激发创造

自路径: 有限标注病理图像分类的自监督学习

本文提出了一种自我监督的深度学习算法，采用CNN实现对病理图像的多任务分类，并结合具有内在标签的预处理任务来实现半监督学习和领域自适应。实验结果表明该算法在病理学图像分类任务中具有较高的性能表现，并能够适用于其他计算病理学应用领域中。

Aug, 2020

在多样病理数据集上进行自监督学习的基准测试

本文介绍了最大规模的自监督学习预训练对计算病理学的影响，并在核实例分割等任务中证明其表现优越，并提出了领域特定技术来提高性能。

Dec, 2022

一种面向计算病理学的通用自监督模型

使用超过100万个组织样本预训练的自我监督模型UNI，在计算病理学中取得了巨大的突破，具有分辨率无关的组织分类、少样本类别原型的幻灯片分类以及疾病亚型分类等新的建模能力，为解决解剖病理学中各种具有挑战性的任务和临床工作流提供了数据高效、泛化和迁移能力的人工智能模型。

Aug, 2023

组织病理学的领域特定优化和多样化自监督模型评估

建立和评估组织病理学基础模型在自我监督学习中的价值，并发现领域特定方法可以进一步提高性能。

Oct, 2023

简化自监督学习复杂度提高计算病理学弱监督分类性能

我们提出了一套适应性方法，可以在资源有限的环境下利用半监督自学习来进行计算病理学研究，从而提高下游分类性能并缩短自学习训练时间。

Mar, 2024

大规模病理基础模型训练之路

本文介绍了基于现代自监督学习算法的深度学习方法的最新进展，以及构建医学图像基础模型的相关工作。我们通过扩展性强的训练流程和综合分析不同超参数选择和训练技术，构建了一系列针对病理学图像的基础模型，并经过实验评估，在乳腺癌亚型分类和结肠癌核分割等不同任务上达到了最先进的性能水平。最后，为了统一领域内的评估方法并简化不同基础模型的比较，我们还提供了开源框架，用于在不同任务中一致评估病理学基础模型。

Mar, 2024

公共自我监督病理基础模型的临床基准测试

利用自我监督学习(SSC)训练病理基础模型的应用在过去几年有了显著增长，公开提供了多个在大量临床数据上训练的模型，将极大地增强计算病理学的科研能力、弥合研究与临床应用的鸿沟。本研究提供了一个包含具有临床相关终点的病理学数据集合，其中包括与癌症诊断以及来自两个医疗中心标准医院运营期间生成的各种生物标记物相关的临床切片，利用这些数据集对公开的病理基础模型的性能进行系统评估，并提供培训新的基础模型和选择适当的预训练模型的最佳实践见解。

Jul, 2024

基准测试基础模型作为弱监督计算病理学的特征提取器

本研究解决了当前病理基础模型在外部队列和临床相关任务中独立评估不足的问题。我们基准测试了十种组织病理基础模型在多个癌症患者的样本上的表现，发现CONCH模型在42%的任务中表现最佳，而融合多个互补基础模型在66%的任务中优于单一模型。研究结果强调数据多样性在模型性能提升中的重要性。

Aug, 2024

计算病理学中的领域泛化算法基准测试

本研究解决了计算病理学中深度学习模型在应用于未见数据时性能下降的问题，缺乏对领域泛化算法的系统评估。通过对30种领域泛化算法在3个不同难度的计算病理学任务上的7560次交叉验证进行基准测试，发现自监督学习和染色增强 consistently 超过其他方法，同时引入了新的全癌症肿瘤检测数据集（HISTOPANTUM）作为未来研究的基准。

Sep, 2024

数字病理学中幻灯片级癌症亚型的基础模型

本研究解决了数字病理学领域模型适应性不足的问题，提出了利用基础模型在大规模领域特定数据集上进行训练的方法。研究发现，基础模型在皮肤癌六个亚型预测方面表现优于使用ImageNet预训练的模型，具有显著的临床应用潜力。

Oct, 2024