Jun, 2018

时序差异变分自编码器

TL;DR本文提出了TD-VAE这个生成式序列模型,它学习了几步之后状态的显式信念,可以直接展开而无需单步转换,用于复杂环境中的计划和行为的模拟。