BriefGPT.xyz
大模型
Ask
alpha
关键词
distributed multi-agent reinforcement learning
搜索结果 - 3
eQMARL: 量子通道上分布式协作的纠缠量子多智能体强化学习
提出了一种名为 eQMARL 的新型框架,通过量子通道促进协作,并通过量子纠缠的分裂评论家消除本地观察共享,实验结果表明,eQMARL 相较于传统的分裂和完全中心化的经典和量子基线,能够在更短的时间内收敛到合作策略,且拥有更高的整体分数,与
→
PDF
a month ago
Minimax Exploiter: 数据高效的竞争自我对弈方法
通过对对手知识的利用,我们提出了一种博弈论方法,即 Minimax Exploiter,在竞争性自博弈的多智能体强化学习中显著提高了数据效率,并在不同环境下验证了其超越强基线的性能。
PDF
7 months ago
带有定向协调图的分布式合作多智能体强化学习
本文提出了一种分布式强化学习算法,该算法使用直接协调图和局部值函数,通过零阶优化方法进行条件估计,没有使用任何共识算法。与现有的基于零阶优化的强化学习算法相比,我们的算法保证了高可扩展性。
PDF
2 years ago
Prev
Next