Sep, 2023

表示学习与强化学习的混合在动态复杂机器人运动规划中的应用

TL;DR混合算法 LSTM 池化和跳跃连接的注意力型离散软演员评论家 (LSA-DSAC) 用于机器人运动规划,取代了基于图的算法并改善了收敛速度。实验证明 LSA-DSAC 在训练和评估中优于最先进的方法,并在实际世界中实施和测试了物理机器人。