CVPRDec, 2019

G3AN: 视频生成中外观和运动的分离

TL;DR提出了一种名为 G$^{3}$AN 的新型时空生成模型,用于捕捉高维视频数据的分布,并以分离的方式模拟外观和动作,在面部表情数据集 MUG 和 UvA-NEMO,以及人类行动数据集 Weizmann 和 UCF101 上显著优于现有方法,并分析了学习到的潜在表示的成功分解。