BriefGPT.xyz
大模型
Ask
alpha
关键词
agent coordination
搜索结果 - 3
多智能体强化学习中推断潜在时间稀疏协调图
在合作多智能体强化学习中,有效的智能体协调至关重要。为了解决现有方法中对历史经验的忽视和稠密图计算的可扩展性问题,我们提出了一种基于潜在时间稀疏协调图的多智能体强化学习方法。该方法利用智能体的历史观测计算智能体对概率矩阵,并基于此矩阵生成稀
→
PDF
3 months ago
学习马尔可夫博弈中基于密度相关均衡的策略
本文提出了基于状态密度的相关均衡(DBCE),它是一种新的 CE 概念,可以更好地满足代理协调和实际应用的安全性和公平性的需求,并通过实验表明了其在状态密度问题场景下的优越性。
PDF
a year ago
ELIGN:基于多智能体内在奖励的期望对齐
该研究探讨在分散型训练或稀疏奖励的情况下,提出了一种自我监督的本质奖励 ELIGN - 期望对齐 - 以及其在多智能体协调问题上的有效性。通过期望对齐代理能够学习到协作行为并且可以进行零次协调,这比基于好奇心的探索方法更加可行。
PDF
2 years ago
Prev
Next