Sep, 2022
移动机器人基于低维感知导航的深度强化学习的确定性和随机分析
Deterministic and Stochastic Analysis of Deep Reinforcement Learning for Low Dimensional Sensing-based Navigation of Mobile Robots
Ricardo B. Grando, Junior C. de Jesus, Victor A. Kich, Alisson H. Kolling, Rodrigo S. Guerra...
TL;DR本文比较了 Deep Deterministic Policy Gradients (DDPG) 和 Soft Actor-Critic (SAC) 两种 Deep-RL 技术在无地图导航移动机器人的表现,我们通过量化数据结果展示神经网络架构对学习的影响,结果表明,随机策略映射 (SAC) 更适合于深层结构,而确定性策略映射 (DDPG) 更适合于浅层结构。