BriefGPT.xyz
Ask
alpha
关键词
cooperative agents
搜索结果 - 5
合作多智体图形赌博机:UCB 算法和遗憾分析
在这篇论文中,我们将多智能体图赌博问题定义为由 Zhang、Johansson 和 Li [CISS 57,1-6(2023)] 引入的图赌博问题的多智能体扩展。我们提出了一种基于上限置信界(UCB)的学习算法 Multi-G-UCB,并证
→
PDF
6 months ago
ProAgent: 利用大型语言模型构建主动合作的人工智能
建立具有适应性行为的人工智能在人工智能与人类合作中具有重要的研究焦点。本研究提出了一种名为 ProAgent 的新框架,利用大型语言模型来预测合作伙伴的决策并改进自身计划。实验证明,ProAgent 在与人工智能代理和人类合作中表现出显著优
→
PDF
10 months ago
PPO 在合作多智能体游戏中令人惊讶的有效性
本研究通过四个流行的多智能体测试环境,证明了基于 PPO 的多智能体算法表现出令人惊讶的性能,并降低了样本复杂度,显示出它可以成为协同多智能体强化学习中的强基线方法。
PDF
3 years ago
具有新兴通讯的网络多智能体强化学习
本研究使用紧密联系的智能体通过互相交流离散符号彼此合作完成任务。通过分析他们之间的交流,证明了他们发展的语言与网络拓扑有关,并在交通控制器问题上实现了最先进的性能。
PDF
4 years ago
群体系统的引导深度强化学习
本文研究了如何使用有限的传感能力控制一组合作智能体,使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估,评估了在寻找和维持距离和定位目标方面的性能。
PDF
7 years ago
Prev
Next