Jun, 2022

强化学习深度非同策略中的动作噪音:对探索和性能的影响

TL;DR针对连续控制 R-DL 领域中的离线深度强化学习所采用的简单探索方式(如加性动作噪声),本文对动作噪音的类型、噪音规模、影响缩放因子的减少计划等进行了分析,并从 Gaussian 和 Ornstein-Uhlenbeck 这两个显著的类型中挑选合适的,通过实验表明,噪声的最佳类型和比例取决于环境,并根据观察结果提出了启发式规则来指导选择动作噪声。