BriefGPT.xyz
Ask
alpha
关键词
cooperative multi-agent
搜索结果 - 2
带有函数逼近的可证明高效合作多智能体强化学习
本文介绍了采用价值迭代和信息交流来解决固定通信预算下,多智能体强化学习问题,并证明了在有限信息交流的异构合作场景下,可以实现 Pareto 最优无悔学习。这个工作将多智能体情境和多武器武装带宽文献中的几个思想推广到了 MDP 和强化学习领域
→
PDF
3 years ago
ICML
带有重尾的协作多智体赌博机
本文提出了一种分散式多智能体算法 (MP-UCB),基於信息传递协议,以强健的估计方式解决条件重尾的协作式随机赌博问题,并证明其具有优异的遗憾度表现。
PDF
4 years ago
Prev
Next