Apr, 2024

利用注意力机制进行基于补丁的生物医学图像分类

TL;DR医学图像分析可以通过一种扎根于自注意机制的创新架构得到促进。传统的卷积神经网络(CNN)在捕捉像素级复杂空间和时间关系时需要帮助,而其卷积窗口的固定大小限制了输入波动。为了克服这些限制,我们提出了基于注意力模型而非卷积的新范式。这些模型作为传统 CNN 的替代品,表现出强大的建模能力和高效获取全局长范围上下文信息的能力。通过将非重叠(vanilla patching)和新颖的重叠移位补丁技术(S.P.T.s)相结合,我们的工作提供了一种解决注意力视觉模型所面临的关键挑战的方法,包括归纳偏差、权重共享、感受野限制和高分辨率数据处理。此外,我们还研究了适应不同图像尺寸到更高分辨率的新颖 Lancoz5 插值技术。实验证据验证了我们模型的一般化效果,并与现有方法进行了有利比较。特别是在充足数据的情况下,基于注意力的方法特别有效,尤其是在集成先进的数据增强方法来增强它们的鲁棒性时。