Dec, 2023

PPO 中的有色噪声:通过相关动作采样改进探索和性能

TL;DR基于彩色噪声的随机策略改进 PPO 探索性能和学习表现,建议在 PPO 中将相关噪声作为默认噪声源。