BriefGPT.xyz
Ask
alpha
关键词
safe primal-dual algorithm
搜索结果 - 1
安全关键强化学习的概率约束
本文探讨了在概率受限制的强化学习中学习安全策略的问题,并提出了两种算法 ——Safe Policy Gradient-REINFORCE 和 SPG-Actor-Critic 以及 Safe Primal-Dual 算法来解决。通过实验,验
→
PDF
a year ago
Prev
Next