Sep, 2017

学习环顾四周:智能探索未知任务的未见环境

TL;DR通过奖励代理的减少未观测环境部分的不确定性的行为,我们提出了一种基于循环神经网络的强化学习方法来实现对自然场景和三维物体的主动完成,并演示了我们的方法学习到的通用策略对于新的未见环境和任务具有较好的泛化性。