Apr, 2022

从自我中心视角视频中预测手部动作和交互热点

TL;DR本研究提出一种通过 Object-Centric Transformer 模型来预测在 egocentric 视频中未来的手部和物品相互作用的方法,并使用概率框架来处理不确定性。在实验中,我们对 Epic-Kitchens-55、Epic-Kitchens-100 和 EGTEA Gaze+ 数据集进行了测试,并显示 OCT 较现有方法显著优越。