Oct, 2022

基于改进近端策略优化的机械臂关节空间障碍物避免

TL;DR该研究提出一种新的基于邻近策略优化(PPO)的无模型强化学习方法,用于训练深度策略将任务空间映射到 6-DoF 机械臂的关节空间,用于解决机器人在随机目标和障碍物下进行的触及任务困难的问题。