Sep, 2022

机器人控制的DRL过程中的部分可观测性

TL;DR本文研究了Deep Reinforcement Learning在机器人控制任务中的应用,特别是在部分可观性条件下,比较了TD3、SAC和PPO算法的表现,并提出了改进部分可观性下TD3和SAC算法鲁棒性的多步版本算法。