Jun, 2019

使用生成环境模型塑造强化学习中的信念状态

TL;DR本文提出了一种在复杂环境中高效训练表现出色的生成模型的方法,通过预测算法和一个表现出色的生成模型,可以在视觉丰富和动态的 3D 环境中形成稳定的信念状态,并且在强型自由基线代理程序中显著提高数据效率。