ICMLJun, 2018

无监督层次化长期视频预测

TL;DR本文提出了一种基于神经网络的 Hierarchical Encoder-Decoder 模型,通过对输入帧进行编码,预测高级别的特征,再通过解码器生成预测图像,同时采用了对抗性损失以训练预测器,该方法可以进行 20 秒预测,并在 Human 3.6M 数据集上取得了更好的结果。