Jun, 2018

QT-Opt:基于视觉的机器人操作的可伸缩深度强化学习

TL;DR本文提出了一种基于QT-Opt的可扩展自监督视觉强化学习框架,该框架能够利用超过580k的真实抓取尝试来训练一个具有超过1.2M个参数的深度神经网络Q函数,实现闭环实际抓取并能够推广到96%的机器人抓取任务中,而且不仅实现了极高的成功率,而且通过RGB视觉感知和操纵,自动学习了重抓策略,动态响应干扰与扰动,并能够重新定位物品和执行其他非抓取前的操作。