NIPSDec, 2015

基于记忆的循环神经网络控制

TL;DR本研究利用 RNN 与反向传播算法,扩展了两个连续控制的无模型算法,能够成功地解决大量的物理控制问题,包括部分受到噪声干扰而需要信息短暂整合的问题,以及需要在多个时间步骤中保留信息的长期记忆问题,并且使用简化版本的 Morris 水迷宫任务进行了探索与记忆结合问题的研究。同时,通过直接从像素中学习,能够处理高维度的观测问题。