BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-agent environments
搜索结果 - 23
ICLR
图卷积强化学习
本文提出了一种使用图卷积强化学习的方法,通过使用关系内核捕获代理之间的相互作用来适应多代理环境的动态,并利用逐渐增大感受野的卷积层产生潜在特征来学习合作,此外,为了保持一致性,还使用了时间关系正则化方法。实验表明,该方法在各种合作场景中显着
→
PDF
6 years ago
非参数通用强化学习
本文提出了在非 Markovian、非 ergodic 且只部分可观察的环境下进行强化学习的问题。作者建立了贝叶斯强化学习代理的负面结果,并证明 Thompson 采样在随机环境中是渐进最优的。此外,作者构建了一个大但可计算的类,展示了基于
→
PDF
8 years ago
IJCAI
使用任意参数模型和模型先验与自利代理进行贝叶斯最优互动的通用框架
提出了一种推广的贝叶斯强化学习方法,通过整合常见的参数模型和模型先验,实现了在自利多智能体环境中对其他智能体行为的精细和简洁表示,具有比现有方法更好的性能。
PDF
11 years ago
Prev
Next