Apr, 2017

数据高效的灵巧操作深度强化学习

TL;DR本研究使用深度学习和强化学习方法解决机器人的熟练操作任务,同样使用了 DDPG 算法来扩展其功能以实现更高效的数据利用与可伸缩性,成功地使用现实世界的抓取和叠放机器人的交互数据训练出其掌握复杂熟练操作技能的有效策略模型。