Dec, 2023

混合变压器在腹腔镜妇科视频中的事件识别

TL;DR我们介绍了一种用于腹腔镜妇科手术视频中相关事件识别的全面数据集,并通过使用几种 CNN-RNN 架构评估事件识别性能。此外,我们介绍并评估了一个混合变压器架构,结合自定义的训练 - 推理框架,用于识别腹腔镜手术视频中的四个特定事件。借助 Transformer 网络,我们的提出的架构利用帧间依赖性来对抗相关内容遮挡,运动模糊和手术场景变化的不良影响,从而显著提高事件识别准确性。此外,我们提出了一种用于处理手术场景和外科医生技能水平变化的帧采样策略,以实现高时间分辨率的事件识别。通过一系列广泛的实验证明了我们所提出的方法在事件识别方面相比传统的 CNN-RNN 架构的卓越性能。