Sep, 2019

基于分离的深度 Q-Learning 算法实现鲁棒的物体分离

TL;DR本文提出了一种推动策略,目的是通过相邻物体和目标物体的横向推动来解决在杂乱环境中从一堆其他物体中提取目标物体的机器人操作问题,使用 DQN 深度强化学习学习最优的推动策略,利用 Split DQN 来提高学习速率和增加算法的模块化。实验证明了该算法在模拟环境中的学习效果,以及其模块化设计可以在不重新训练模型的情况下添加新的算法原语。