Mar, 2021

大规模视频预测的贪心分层变分自编码器

TL;DR介绍了一种基于 Greedy Hierarchical Variational Autoencoders (GHVAEs) 的高保真度视频预测模型,能够解决 GPU 或 TPU 的内存限制和大规模视频预测的优化难题,并在四个视频数据集上取得了 17-55% 的预测性能提升和 35-40% 更高的成功率。