Mar, 2024

走向场景图预测

TL;DR分析了视频中的时空场景图,提出了 SceneSayer 方法,通过对观察到的视频帧进行推理,模拟对象之间关系的演化,并使用神经常微分方程和神经随机微分方程来预测对象之间的未来关系。在 Action Genome 数据集上进行了大量实验验证了该方法的效果。