May, 2021

VPN++:重新思考视频姿态嵌入以理解日常活动

TL;DR提出了 Video-Pose Network (VPN) 用于识别日常活动,该模型包含两个不同的方向:一个是通过特征层面的蒸馏将 Pose 知识转移到 RGB 中,另一个是通过注意层面的蒸馏模仿姿势驱动的注意。该模型在 4 个公共数据集上表现出了高速且具有噪声姿势的鲁棒性。