Dec, 2019

控制梦境:通过潜在想象学习行为

TL;DR使用潜意识想象力,在学习世界模型的基础上,Dreamer 这一强化学习代理能够纯粹通过图像解决长周期任务,具有数据效率高,计算时间短和最终性能强等优势。