Jun, 2024

揭开 U-Net 模型中感受野尺寸对医学图像分割效果的神秘

TL;DR医学图像分割是医疗应用中关键的任务,本研究探讨了 U-Net 和 Attention U-Net 架构中的感受野(RF)大小及其对模型性能的影响,研究了 RF 大小与感兴趣区域特征、模型性能以及计算成本之间的关系,提出了表示给定网络层的理论感受野(TRF)的数学符号,并提出了两个新的度量指标 - 有效感受野(ERF)率和对象率来定量 ERF 内显著贡献像素的比例和分割对象相对于 TRF 大小的大小比。结果表明,存在一个最佳的 TRF 大小,成功地在捕获更广泛的全局背景信息和保持计算效率之间取得平衡,从而优化模型性能。注意力机制的 U-Net 模型始终优于基本 U-Net 模型,无论 TRF 大小如何。这些新颖的发现为开发用于医学成像的更高效 U-Net 架构提供了宝贵资源,并为未来的研究铺平了道路。还开发了一种计算 U-Net(和 Attention U-Net)模型的 TRF 的工具,并为给定模型和数据集建议了适当的 TRF 大小。