Jun, 2024

无线胶囊内镜基于 Swin Transformer 和 RT-DETR 的出血帧分类与检测的稳健流程

TL;DR本文描述了我们在 Auto WCEBleedGen 挑战赛 V2 2024 中的方法,结合了 Swin Transformer 用于出血帧的初步分类以及 RT-DETR 用于进一步检测无线胶囊内窥镜图像中的出血,同时还采用了一系列图像预处理步骤,包括将图像转换为 Lab 颜色空间,使用限制对比适应性直方图均衡化(CLAHE)进行对比度增强,以及使用高斯模糊抑制伪影。该方法在验证集上达到了 98.5%的分类准确率(优于其他最先进模型的表现),相较于无任何预处理的 91.7%,在 $ ext {AP}_{50}$ 上达到了 66.7%(相较于最先进的 YOLOv8 的 65.0%)。在测试集上,该方法的分类准确性和 F1 得分分别为 87.0%和 89.0%。