Oct, 2017
基于图像的机器人学习的非对称演员 - 评论家算法
Asymmetric Actor Critic for Image-Based Robot Learning
Lerrel Pinto, Marcin Andrychowicz, Peter Welinder, Wojciech Zaremba, Pieter Abbeel
TL;DR本研究使用深度强化学习的 actor-critic 算法,利用物理模拟器的完全状态可观测性,针对机器人操作中的部分观测(RGBD 图像)的问题进行训练,通过使用不对称输入来显著提高性能,并使用领域随机化的方法,实现了在没有真实世界数据的情况下,在真实机器人上进行的模拟到真实世界的转移。