Oct, 2017

基于图像的机器人学习的非对称演员-评论家算法

TL;DR本研究使用深度强化学习的actor-critic算法,利用物理模拟器的完全状态可观测性,针对机器人操作中的部分观测(RGBD图像)的问题进行训练,通过使用不对称输入来显著提高性能,并使用领域随机化的方法,实现了在没有真实世界数据的情况下,在真实机器人上进行的模拟到真实世界的转移。