May, 2024

EMAG: 自我动作感知的、通用化的从第一人称视频中预测二维手势

TL;DR从利用自我中心视频预测未来人类行为具有挑战性但又至关重要的任务入手,本文提出了一种理解人类意图的自我中心视频下的手预测方法,该方法解决了自我中心视频中的自我运动对未来帧中的 2D 手位置的严重影响以及基于视觉信息预测过度拟合背景或场景纹理的问题,并在大规模数据集上验证了其有效性。