关键词long-term anticipation
搜索结果 - 2
- 走向场景图预测
分析了视频中的时空场景图,提出了 SceneSayer 方法,通过对观察到的视频帧进行推理,模拟对象之间关系的演化,并使用神经常微分方程和神经随机微分方程来预测对象之间的未来关系。在 Action Genome 数据集上进行了大量实验验证了 - CVPR未来的 Transformer 用于长期行动预测
提出了一种全新的基于注意力机制的动作预测模型,称为 Future Transformer (FUTR),它能够学习全局的视频动作信息,以预测长达数分钟的未来动作序列,和传统的自回归模型相比,FUTR 可以更准确、更快速地进行长期预测。在两个