BriefGPT.xyz
Ask
alpha
关键词
parameter noise
搜索结果 - 1
ICLR
参数空间噪声用于探索
通过将参数噪声与传统深度强化学习方法相结合,可以在高维离散行动环境和连续控制任务中比传统深度强化学习方法和进化策略更有效地学习,并且在离散和连续领域中参数噪声会比动作空间噪声更优秀。
PDF
7 years ago
Prev
Next