Apr, 2024

针对医学图像通用分割的混合双金字塔 Transformer-CNN 的注意力门控重新思考

TL;DR本研究提出了一种新型混合 CNN-Transformer 分割架构 (PAG-TransYnet),通过在双金字塔混合编码器中利用注意力门,利用金字塔输入突出显示不同尺度的突出特征,将 PVT Transformer 引入以捕获多种分辨率的长距离依赖,并通过实施双注意力门机制来有效融合 CNN 和 Transformer 分支的突出特征。通过对不同分割任务的综合评估,包括腹部多器官分割、感染分割 (新冠肺炎和骨转移)、显微组织分割 (腺体和细胞核),所提出的方法展现了领先的性能,并展示了出色的泛化能力。该研究在医学成像应用中对于高效和适应性分割解决方案的迫切需求方面取得了重要进展。