CVPRApr, 2022

基于 4D 骨骼增强的上下文感知序列对齐

TL;DR本文提出了一种新的上下文感知自监督学习架构(CASA), 该架构基于现成的人体姿态估计器,以解决视频中人类动作时间对齐的问题。CASA 通过引入自注意力和交叉 - 注意机制,结合人类活动的时空上下文,有效地解决了时间间断性的问题,并通过 4D 姿势表示的新颖增强技术来增强其自监督学习方案,实验结果表明,在三个公共数据集上,CASA 方法显著提高了相位进度和 Kendall Tau 得分比之前的最先进方法。