Dec, 2023

关于组织切片级别分类神经网络的校准

TL;DR深度神经网络在数字病理学中的全切片图像中预测某些生物标志物时表现出有希望的分类性能,但网络输出概率的校准经常没有得到评估。在医学环境中,通过提供可靠的置信度评分来传达不确定性具有很高的相关性。在这项工作中,我们比较了三种神经网络结构,这些结构将修补水平上的特征表示与幻灯片级别的预测相结合,以评估它们的分类性能并评估其校准性。作为幻灯片级别分类任务,我们选择了结直肠癌组织切片中的微卫星不稳定性的预测。我们观察到,Transformers在分类性能和校准方面表现出良好的结果。在对单独数据集进行分类性能评估时,我们观察到Transformers具有最好的泛化能力。对可靠性图进行调查能够提供对期望校准误差指标的额外见解,我们观察到特别是Transformers会将输出概率推至极值,这导致过于自信的预测。