Nov, 2023

腔镜手术视频中的动作识别

TL;DR在这项研究中,我们设计并评估了一个CNN-RNN架构以及一个定制的训练-推理框架,以应对腹腔镜手术行动识别中的挑战,包括动作持续时间变异、烟雾、血液积聚、快速相机运动、器官移动、物体阻挡等相关内容扭曲,以及不同照明和视角引起的手术场景变化。通过使用堆叠的循环层,我们的网络利用帧间依赖性来消除内容扭曲和动作识别中的变异的负面影响。此外,我们提出的帧采样策略有效地管理手术动作的持续时间变化,实现了高时间分辨率的动作识别。我们广泛的实验证实了我们的方法在动作识别方面相比静态CNN更为优越。