Jul, 2017

深度强化学习中的想象增强智能体

TL;DR介绍了一种结合了model-free和model-based特点的deep reinforcement learning方法——Imagination-Augmented Agents(I2As),相比于现有的model-based基于规则的reinforcement learning和planning方法,I2As通过学习来解释环境模型的预测,以任意方式构建隐式计划,使用预测作为深度策略网络中的额外上下文,相比于基线算法,在数据效率,性能和鲁棒性方面获得了改进。