关键词multi-agent cooperation
搜索结果 - 13
- 基于 LLM 的合作智能体,利用信息相关性和计划验证
我们通过与三维场景进行互动和协作来解决多智能体合作的挑战,重点解决现有合作智能体系统的三个主要限制,并提出 REVECA,这是一种由 GPT-3.5 驱动的新型认知架构,利用相关性评估、计划验证和空间信息来增强智能体在动态和部分可观测环境中 - 社会困境中的合作:多主体,人 - 主体与更多:一项综述调查
探讨了人工智能与合作在社会困境中交叉的三个关键领域,包括多智能体合作、人工智能与人类合作以及运用人工智能增强人与人之间的合作,并提出了未来研究方向。
- CycLight:使用循环级策略学习交通信号配合
本研究引入了 CycLight,一种新颖的基于循环层次的深度强化学习方法,用于网络级自适应交通信号控制系统。与大多数传统的基于强化学习的交通控制器不同,CycLight 采用了循环层次的策略,使用参数化深度 Q 网络算法同时优化循环长度和分 - 使用大语言模型模块化地构建合作体验智能体
论文提出了一种新的基于大型语言模型的多智能体合作框架,在多种身体环境中测试并得到了良好的效果,其具备规划、沟通和与其他人类或智能体合作完成长期任务等能力,并且与人类沟通的模型更容易获得信任,这为未来的智能体合作研究奠定了基础。
- 分布式多智能体协作的对手建模层次强化学习
本文介绍了一种基于深度强化学习的多智能体协作方法,通过分布式学习实现了高效的策略搜索,并在合作变道场景中进行了仿真和实际案例验证。
- 为多智能体协作学习个体推断通信
提出了 Individually Inferred Communication 模型,通过因果推断学习通信先验,并利用前馈神经网络实现代理之间的通信。该模型成功地减少了通信开销并提高了多种多代理合作场景中的表现。
- ICML个体性的出现
本文提出了一种基于强化学习的多智体合作算法,特别着重于个体化。这种算法学习一个概率分类器来预测代理人身份,从而赋予每个代理人固有的动机,鼓励代理人访问自己熟悉的观测,促进个体性的出现,并在多种多智体协同情景中显著优于现有方法。
- MM注重信息,忽略不重要的:指称游戏中的沟通策略
本文研究了多代理协作,发现当人工智能代理学习玩简单参考游戏的同时,也能够建立共享的词汇表。通过分析神经网络代理在简单的参考游戏中使用符号进行对象映射的策略,发现对于非均匀分布的环境,代理人将忽略无用特征并更好地利用其他特征进行通信,这为语言 - AAAI心智理论:逆向规划探寻群体行为
本文提出了一个基于 Composable Team Hierarchies 的生成式模型,通过贝叶斯推理来推断潜在的关系并预测多个智能体在空间随机游戏中的行为,该算法可以迅速恢复智能体之间如何相关的基本模型,算法的推理模式与人类判断非常相似 - 演化内在动机以促进利他行为
本篇论文研究多智体系统中的合作问题,发现可通过结合自然选择与 MARL 来实现无模型的协作特征学习,支持多层次选择的创新模块化架构结构为此提供了解决方案。
- ECCV细粒度分类导航学习
本研究针对细粒度分类难以找到区分特征的问题,提出了一种新颖的自我监督机制,通过 Navigator、Teacher 和 Scrutinizer 三种代理的多方协作,达到有效定位信息区域的目的,实现了自下而上的特征学习和分类,不需要边界框 / - NIPS学习注意交流以实现多智能体协作
本文提出了一种注意力通信模型,能够学习何时需要进行通信以及如何将共享信息集成到合作决策中,以实现大规模多智能体协作的高效和有效通信,从而在合作情境中比现有方法展现出更具协调性和更复杂的策略。
- 共同体多智能体强化学习的参数共享深度确定性策略梯度
本文探讨基于 actor-critic 方法的合作多智能体问题,在局部观察设置下,在神经网络的基础上提出了参数共享确定性策略梯度方法,包括演员评论家共享、演员共享和部分共享评论家的演员共享等三个变体,该方法在学习速度、内存效率和智能体数量方