May, 2017

从视频中无监督地学习解缠表示

TL;DRDrNET 是一种用于学习从视频中生成分离图像表示的新型模型,通过利用视频的时间一致性和新型的对抗性损失函数来学习一种表示,该表示将每一帧分解为一个固定部分和一个随时间变化的成分,这种分离的表示可以用于一系列任务,例如将标准 LSTM 应用于随时间变化的成分,从而预测未来的帧。