BriefGPT.xyz
Oct, 2017
基于图像的机器人学习的非对称演员-评论家算法
Asymmetric Actor Critic for Image-Based Robot Learning
HTML
PDF
Lerrel Pinto, Marcin Andrychowicz, Peter Welinder, Wojciech Zaremba, Pieter Abbeel
TL;DR
本研究使用深度强化学习的actor-critic算法,利用物理模拟器的完全状态可观测性,针对机器人操作中的部分观测(RGBD图像)的问题进行训练,通过使用不对称输入来显著提高性能,并使用领域随机化的方法,实现了在没有真实世界数据的情况下,在真实机器人上进行的模拟到真实世界的转移。
Abstract
deep reinforcement learning
(RL) has proven a powerful technique in many sequential decision making domains. However,
robotics
poses many challenges for RL, most notably training on a physical system can be expen
→