Mar, 2018

可组合的深度强化学习在机器人操作中的应用

TL;DR本研究探讨软 Q-learning 方法在真实世界机器人操作中的应用,证明软 Q-learning 方法比先前的模型自由深度强化学习方法具有更高的采样效率,并且可以通过将学习到的策略组合创建新的策略,从而在真实世界机器人操作中提供高效的工具。