Nov, 2019

预测人 - 物互动:第一视角视频中运动注意力和动作的联合预测

TL;DR本文提出了一种基于未来意图总揽机制的深度学习模型,该模型综合建模并预测了自我中心手部运动、交互热点和未来动作,旨在解决人 - 物互动预测的重要挑战。实验结果表明,所述模型在 EGTEA Gaze+ 和 EPIC-Kitchens 数据集上的行动预测结果优于现有方法。