Sep, 2022

机器人控制的 DRL 过程中的部分可观测性

TL;DR本文研究了 Deep Reinforcement Learning 在机器人控制任务中的应用,特别是在部分可观性条件下,比较了 TD3、SAC 和 PPO 算法的表现,并提出了改进部分可观性下 TD3 和 SAC 算法鲁棒性的多步版本算法。