BriefGPT.xyz
Ask
alpha
关键词
adaptive mixture rates
搜索结果 - 1
AAAI
深度保守策略迭代
本文研究了将经典的 Conservative Policy Iteration 算法应用于深度强化学习中的实际问题,并引入了自适应混合比率的概念,通过在 Cartpole 问题和 Atari 游戏中的实验验证了该算法的有效性和稳定性,表明重
→
PDF
5 years ago
Prev
Next