Oct, 2023

ACT-Net:手术视频中的锚点上下文动作检测

TL;DR为了精确检测每一时刻发生的细微行动,我们提出了一种锚点上下文行动检测网络(ACTNet),包括锚点上下文检测模块和类条件扩散模块,以回答以下问题:1)行动发生在哪里;2)行动是什么;3)如何进行置信度预测。我们的方法在外科手术视频数据集上表现出最新技术水平,相比基准线改进了 4.0%的平均精确度。