BriefGPT.xyz
Ask
alpha
关键词
randomized value function learning
搜索结果 - 1
NIPS
并发强化学习中的可扩展协调探索
在一个公共环境下,考虑一组同时运行的强化学习智能体,我们提出了一种适用于实际规模问题的高效协同探索方法,该方法建立在种子抽样和随机值函数学习的基础上,并证明该方法在简单表格式上与先前提出的表格式学习方法相当竞争力,在高维度问题和神经网络值函
→
PDF
6 years ago
Prev
Next