ECCVAug, 2020

几个视频中的共同动作定位

TL;DR本文提出了一种利用少量样本实现在长视频中定位动作的方法,通过新的三维卷积神经网络,结合相互增强、逐步对齐和成对匹配等模块,成功地对单一或多个动作实例的长视频进行了精准定位。