ICCVOct, 2021

HighlightMe: 从人类中心视频中检测亮点

TL;DR文章介绍了一种基于图形表示多个可观测到的人类中心模式(例如姿势和面部表情)的视频的方法,使用带有空间 - 时间图卷积的自动编码器网络来检测基于这些模式的人类活动和互动,并将这些模式的基于活动和互动的潜在结构表示映射到基于帧的高亮度分数,用于计算哪些帧需要突出显示并拼接相邻帧以产生摘录。该方法无需用户提供的偏好或特定数据集的微调,可提高与这些数据集中现有方法相比的平均精度。