ICCVMay, 2023

基于关键点的视频理解中,学习更高阶的物体交互

TL;DR本文介绍了一种名为 KeyNet 的行动定位方法,仅利用基于目标的关键点数据来捕获场景中的上下文,从而在不使用任何 RGB 信息的情况下从对象和人类关键点中建立结构化中间表示,演示了如何从对象关键点中建模以恢复使用 AVA、动力学数据集上的关键点信息造成的上下文损失。