Mar, 2024

噪声的尖峰演员网络探索

TL;DR通过引入时序相关的噪音,我们提出了一种噪声尖峰神经体执行者网络(NoisySAN)来解决深度强化学习中的探索问题,并提出了一种噪音减少方法,以找到智能体的稳定策略。大量实验结果表明,我们的方法在 OpenAI gym 的各种连续控制任务中表现优于现有技术水平。