Mar, 2018

离散序列自编码器

TL;DR这篇论文介绍了一种针对高维时序数据(如视频或音频)的 VAE 模型架构,学习了数据的潜在表示,可以近似地分解潜在的时间相关特征(动态)和随时间保持不变的特征(内容),从而进行内容和动态的部分控制,并给出了在人工生成的卡通视频片段和声音记录上的实验证据,进一步论证了随机 RNN 模型相对于确定性 RNN 对长序列的压缩与生成的效率更高的假设。