Sep, 2023

基于机械臂的仿真到实际深度强化学习用于拾取和放置

TL;DR该研究提出了一种自监督视觉深度强化学习方法,使得机器人可以有效地在模拟环境和真实环境之间直接转移训练模型,并特别设计了一种高度敏感的行动策略用于处理拥挤和堆叠的物体,实验证明即使没有经过实际环境微调,该模型在真实吸附任务中的吸附成功率也能保持较高,还能在真实实验中吸附新物体并保持 90% 的成功率。