ICCVApr, 2017

AMTnet:端到端可训练深度架构的动作 - 微管回归

TL;DR本论文提出了一种新的深度神经网络框架,称之为 3D-RPN 网络,能够在纯粹利用外观的情况下有效地编码动作的时间方面。这个模型是端到端可训练的,可以在单个步骤中联合优化动作定位和分类。在测试时,该网络预测了包含两个连续帧的微小管,而新算法则能够利用网络学习的时间编码来将它们组合成完整的动作管,计算时间减少了 50%。实验结果证明,该模型在仅利用外观的情况下优于同类方法,在 J-HMDB-21 和 UCF-101 动作检测数据集上表现良好。