BriefGPT.xyz
Ask
alpha
关键词
actor critic methods
搜索结果 - 1
约束的演员 - 评论家算法和约束的自然演员 - 评论家算法的有限时间分析
通过应用 Lagrange 乘数法,我们对带有不等式约束的 C-MDP 中的 actor critic 和 natural actor critic 算法进行了非渐近分析,并证明这些算法在非独立同分布(Markovian)环境中能够找到性能
→
PDF
8 months ago
Prev
Next