BriefGPT.xyz
Ask
alpha
关键词
recurrent rl agent
搜索结果 - 2
一种智能无服务器函数的深度递归强化学习方法
通过将模型无关的循环强化学习(Recurrent RL)代理与最先进的 PPO 算法相结合,我们研究了用于函数自动缩放的模型无关的 Recurrent RL 代理,并将其与基于阈值的函数自动缩放进行了比较,发现循环策略能够捕捉环境参数并在函
→
PDF
a year ago
在文本游戏中计数以探索和泛化
本论文提出了一种带有片段式探索机制的循环强化学习代理,在文本游戏环境中发现良好策略。我们在一系列生成的文本游戏中展示了有希望的结果,游戏难度各异,目标是在一系列房间的末尾收集硬币。与以往的文本强化学习方法相比,我们发现我们的代理学习到可以泛
→
PDF
6 years ago
Prev
Next