BriefGPT.xyz
Ask
alpha
关键词
robocup soccer
搜索结果 - 2
参数化深度 Q-Networks 学习:离散 - 连续混合动作空间增强学习
在本文中,我们提出了一种带参数的深度 Q 网络(P-DQN)框架,用于处理混合行动空间,此算法无需任何逼近或者弛豫,充分发挥 DQN 和 DDPG 精神,并且在 RoboCup 足球和王者荣耀游戏中的仿真实验证明了我们方法的有效性。
PDF
6 years ago
参数化行动空间下的深度强化学习
该论文研究了在 RoboCup 足球模拟领域中使用深度强化学习中的深度神经网络来处理参数化连续动作空间,成功地拓展了深度强化学习到参数化行动空间 MDPs 的类别,并比 2012 RoboCup 冠军代理更可靠地得分。
PDF
9 years ago
Prev
Next