TransUNet:使用 Transformers 强大编码器进行医学图像分割
通过在 2D TransUNet 体系结构的基础上建立在最先进 nnU-Net 体系结构的基础上,充分探索 Transformers 在编码器和解码器设计中的潜力,我们引入了两个关键组件:1)一个从卷积神经网络(CNN)特征图中令图像块标记化的 Transformer 编码器,从而实现全局上下文的提取;2)一个自适应地利用候选区域和 U-Net 特征之间的交叉注意力进行候选区域的精炼的 Transformer 解码器。我们的研究发现,不同的医学任务受益于不同的体系结构设计。Transformer 编码器在多器官分割中表现出色,其中器官之间的关系至关重要。另一方面,Transformer 解码器在处理小而具有挑战性的分割目标(如肿瘤分割)方面更有益处。大量实验证明了将基于 Transformer 的编码器和解码器集成到 U 型医学图像分割体系结构中的巨大潜力。TransUNet 在各种医学应用中超越竞争对手。
Oct, 2023
我们提出了一种简单而有效的 UNet-Transformer(seUNet-Trans)模型,用于医学图像分割,结合了 CNN-based 模型和 Transformer 模型,在多个医学图像分割数据集上进行了广泛实验,显示出优于其他几种先进模型的性能。
Oct, 2023
本篇论文介绍了一种新的 UNETR 架构,通过使用 Transformer 作为编码器,可以捕捉更长程的空间依赖性,同时保持 “U 形” 的网络设计。实验证明,在多个数据集上,该方法在多器官分割任务上取得了最新的最优性能。
Mar, 2021
本文提出了一种将 LeViT Transformer 模块集成到 U-Net 结构中的快速、准确的医学图像分割解决方案,该方案在多项挑战性医学图像分割基准测试中展示了良好的性能。
Jul, 2021
该研究提出了 Swin-Unet,一种基于 Transformer 的 Unet 用于医学图像分割,它通过层次 Swin Transformer 与 SHIFT 窗口技术来提取上下文特征,使得该纯 Transformer 的编码解码网络在多器官和心脏分割任务方面表现超越传统的基于卷积和变换的方法。
May, 2021
介绍了 Dilated-UNet,结合了 Dilated Transformer 块和 U-Net 架构,用于快速准确地进行医学图像分割,并在多个具有挑战性的医学图像分割数据集上取得了优于其他模型的成果。
Apr, 2023
本研究提出了 Dual Swin Transformer U-Net (DS-TransUNet) 框架,它是第一次尝试将 Swin Transformer 的优势同时融入到标准 U 形架构的编码器和解码器中,以提高不同医学图像的语义分割质量。实验表明,DS-TransUNet 显著优于现有的医学图像分割方法。
Jun, 2021
本研究提出 UTNet,这是一种简单而强大的混合 Transformer 体系结构,它将 self-attention 集成到卷积神经网络中,以增强医学图像分割,通过在编码器和解码器中应用 self-attention 模块来捕捉不同尺度的长程依赖关系,并提出了一种有效的 self-attention 机制与相对位置编码,从而将 self-attention 操作的复杂度从 $O (n^2)$ 降低到约 $O (n)$。在多标签、多厂商的心脏磁共振成像队列上对 UTNet 进行了评估,所示分割性能优异,对抗最先进的方法表现出很好的鲁棒性,有望在其他医学图像分割中具有广泛的应用前景。
Jul, 2021
本研究提出了一种名为 DA-TransUNet 的新型深度医学图像分割框架,将 Transformer 和双注意力块引入传统 U 形架构的编码器和解码器中,通过注意力机制和多方面特征提取来增强医学图像分割,并通过实验结果证明 DA-TransUNet 在各个医学图像分割基准测试中显著优于现有方法。
Oct, 2023
引入了 U-Transformer 网络,结合了用于图像分割的 U 形模型和 Transformer 的自注意和交叉注意力机制,有效地克服了 U-Net 难以对长程上下文交互和空间依赖性建模的问题,在两个腹部 CT 图像数据集上表现出明显的优势。
Mar, 2021