BriefGPT.xyz
Ask
alpha
关键词
smooth policy
搜索结果 - 1
ICML
稳健且平滑的深度强化学习策略
提出了新的 Deep RL 框架 $ extbf {SR}^2 extbf {L}$,通过引入 smoothness-induced regularization,使学习到的 policy 对连续状态空间的过渡 smooth,提高抗扰动能力
→
PDF
4 years ago
Prev
Next