Sep, 2022

使用先前政策指导的强化学习对双臂自由浮动空间机器人进行运动规划

TL;DR我们提出了一种新的算法 EfficientLPT,通过使用混合策略、引入先验知识,以及采用无穷范数构建合理的奖励函数来提高强化学习方法的规划精度,从而解决了双臂自由浮动空间机器人动作规划中无法捕捉非合作对象的问题,并通过旋转速度不同的物体捕获任务验证了该方法的有效性。