CVPRJul, 2020

通过视频注意力和时间上下文进行自我中心动作识别

TL;DR这篇文章介绍了三个方法:动作识别、动词和名词分类以及空间 - 时间视频注意力模型来解决小动态物体、复杂手部物体交互和遮挡等挑战。