Dec, 2019

G3AN: 视频生成中外观和运动的分离

TL;DR提出了一种名为G$^{3}$AN的新型时空生成模型,用于捕捉高维视频数据的分布,并以分离的方式模拟外观和动作,在面部表情数据集MUG和UvA-NEMO,以及人类行动数据集Weizmann和UCF101上显著优于现有方法,并分析了学习到的潜在表示的成功分解。