CVPRMar, 2022

从单张图片合成一致的长期 3D 场景视频

TL;DR在这篇论文中,我们提出了一种新的方法来从单个场景图像和大摄像机动作轨迹中综合出一致的长视频,并使用自回归 Transformer 以及基于摄像机的局部性约束来预测多个帧之间关系和下一帧,从而实现了对多帧的序列建模,优于现有的方法,尤其是在室内 3D 场景的长期未来合成中表现出色。