Oct, 2023

医疗系统规模下的计算病理学 -- 来自三十亿图像的自监督基础模型

TL;DR最近在自我监督学习方面的突破已经实现了使用大规模无标签数据集来训练视觉基础模型,该模型可以推广到各种下游任务。本项目的目标是训练最大的学术基础模型,并通过在大型临床病理数据集上的预训练和下游性能评估来对最重要的自我监督学习算法进行基准测试。结果表明,与自然图像的预训练相比,病理数据的预训练对下游性能是有益的。此外,DINO 算法在所有测试任务中实现了更好的泛化性能。这些结果标志着计算病理学研究的一个阶段性变化,为基于大规模、并行预训练的更高性能模型开辟了新时代。