Oct, 2023

Swin-Tempo: 使用 Swin Transformer 增强的 UNet 在 CT 扫描作为视频序列中具有时间感知的肺结节检测

TL;DR我们提出了一种创新模型,结合了卷积神经网络和视觉变换器的优势,将每个 3D CT 图像视为视频,每个切片视为帧,将肺结节视为对象,使其能够进行时间序列应用,以克服模型训练过程中的硬件限制,实现对 2D 数据的高效处理,并利用 3D 图像上下文进行准确识别。通过对公开可用的 Lung Nodule Analysis 2016 数据集应用 10 折交叉验证技术,验证了我们提出的网络的有效性。我们的网络在平均敏感性指标上达到了 97.84%的准确度以及 96.0%的竞赛性能指标(CPM),其参数较少。与肺结节识别领域最先进的技术进行对比分析,证明了我们提出的模型的显著准确性。