Oct, 2019

基于视觉感知的风险感知机器抓取的分位数 QT-Opt

TL;DR本研究探讨利用分布式 Q-learning 算法的分布透视理论在连续状态空间下的应用,提出了一种新的基于分位数的 Q-learning 算法 Q2-Opt,成功应用于视觉机器人夹取任务,并探究了其风险扭曲函数,同时采用批量强化学习算法进行实验,与以往变量离散的实验结果对比,结果表明 Q2-Opt 在机器人夹取任务机器人夹取成功率上的表现更为优异。