Mar, 2023

DiffTAD: 带有提案去噪扩散的时间动作检测

TL;DR本文提出了一种使用扩散去噪的新时域动作检测(TAD)方法,名为 DiffTAD。该方法采用生成建模方法,而非以往判别式学习方法,借助 Transformer decoder 中引入的时间位置查询设计来建立去噪过程,通过交叉步选择性调节算法来提高推断速度。在 ActivityNet 和 THUMOS 上广泛评估后,我们的 DiffTAD 相比以往的艺术选择方案,表现出卓越的性能。