ICCVFeb, 2021

松弛 Transformer 解码器用于直接行动提议生成

TL;DR这篇论文提出了 RTD-Net 框架,利用 Transformer 类似的架构直接生成动作建议,通过在时间范围内更好地捕捉长程时间信息的边界注意模块来应对视频中的缓慢先前,通过松弛匹配方案来缓解对每个真实值的单一分配的限制,并使用三分支头明确地预测其完整性来进一步提高提案置信度,从而在 THUMOS14 和 ActivityNet-1.3 基准测试中具有很好的效果,同时比以前的提案生成方法更有效率。