BriefGPT.xyz
Ask
alpha
关键词
relational policy learning
搜索结果 - 1
从奖励中学习关系规则
本文通过关系强化学习来理解认知系统如何选择在特定任务中有用的特征关系以及如何利用这些表达来有效地与环境交互。我们使用建立在 RRL 中开发的函数逼近器的简单模型来展示我们的方法的潜力,并在需要考虑日益增多的潜在关系的三个 Atari 游戏中
→
PDF
2 years ago
Prev
Next