BriefGPT.xyz
Ask
alpha
关键词
cooperative behaviors
搜索结果 - 5
N 代理临时团队合作
在多智能体环境中学习合作行为的现有方法通常假设相对限制性的情景,在完全合作的多智能体强化学习中,学习算法控制着场景中的所有智能体,而在特定团队合作中,学习算法通常只控制场景中的单个智能体。然而,在现实世界中,许多合作场景要求更灵活的学习方法
→
PDF
3 months ago
CMAT:增强小型语言模型的多智能体协作优化框架
我们提出了一个新的通信代理框架,结合多智能体系统和环境反馈机制,提供了一种可扩展方法来探索合作行为。尽管参数较少,我们的 TinyAgent-7B 模型表现与 GPT-3.5 相当,这意味着大规模语言模型在效率和效果上取得了实质性改进。
PDF
3 months ago
基于 AutoDRIVE 生态系统的合作与竞争自主车辆多智能体深度强化学习
该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略,并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F
→
PDF
10 months ago
ICLR
使用多智能体强化学习理解世界以解决社会困境
本论文采用多智能体强化学习与世界模型相结合的方法来研究社会困境中智能体的协作行为,并证明通过使用世界模型可以引导智能体实现复杂的协调行为。
PDF
a year ago
机器人团队的分布式强化学习:回顾
本文总结了分布式无模型多智能体强化学习在多机器人协作中面临的挑战以及现有的解决方案类别,并介绍了基准测试和机器人应用,同时讨论了当前的研究方向。
PDF
2 years ago
Prev
Next