Mar, 2018
可组合的深度强化学习在机器人操作中的应用
Composable Deep Reinforcement Learning for Robotic Manipulation
Tuomas Haarnoja, Vitchyr Pong, Aurick Zhou, Murtaza Dalal, Pieter Abbeel...
TL;DR本研究探讨软 Q-learning 方法在真实世界机器人操作中的应用,证明软 Q-learning 方法比先前的模型自由深度强化学习方法具有更高的采样效率,并且可以通过将学习到的策略组合创建新的策略,从而在真实世界机器人操作中提供高效的工具。