Sep, 2022

移动机器人基于低维感知导航的深度强化学习的确定性和随机分析

TL;DR本文比较了 Deep Deterministic Policy Gradients (DDPG) 和 Soft Actor-Critic (SAC) 两种 Deep-RL 技术在无地图导航移动机器人的表现,我们通过量化数据结果展示神经网络架构对学习的影响,结果表明,随机策略映射 (SAC) 更适合于深层结构,而确定性策略映射 (DDPG) 更适合于浅层结构。