Aug, 2023

健壮视频预测器的自然视频序列长期预测

TL;DR预测高维视频序列是一个异常困难的问题,由于不确定性,给定视频序列的可能未来数量随时间呈指数增长,尤其在从有限世界的快照中预测复杂的自然视频场景时更为明显。本文介绍了一系列改进现有工作的方法,有助于创建鲁棒的视频预测器(RoViPs)。我们通过深度感知和基于不确定性的重建损失的组合,展示了高质量的短期预测能力。利用基于注意力的跳跃连接允许输入特征的长程空间移动,进一步提高性能。最后,我们展示了通过使预测器对其自身的预测错误具有鲁棒性,可以使用迭代的逐步预测任务生成非常长且逼真的自然视频序列。