multi-agent collaboration | BriefGPT

关键词multi-agent collaboration

搜索结果 - 17

跨团队合作的多智能体软件开发
通过引入跨团队合作（CTC）框架，实现协同的团队制定各种决策并在跨团队合作环境中进行沟通，从而提高软件开发中的质量，展示了多智能体合作的潜力和广泛适应性。
PDF21 days ago
基于大型语言模型的多智能体协作的扩展
通过研究多智能体协作中增加智能体的性能以及神经扩展定律，本文提出了多智能体协作网络（MacNet）作为一种组织智能体并通过拓扑排序优化其交互推理的方法，实验证明 MacNet 在各种网络拓扑中表现优异，并且支持超过一千个智能体之间的协作；此
PDF23 days ago
迈向高效的 LLM 对实体多智能体协作的隶属
通过引入增强优势反馈（ReAd）的多智能体协作模型，我们提出了一种新的用于解决复杂物理世界中大型语言模型（LLMs）推理能力的框架，该框架通过对 LLM 计划数据进行评论回归来学习顺序优势函数，并将 LLM 规划器视为最优化器生成最大化优势
PDFa month ago
ROMA-iQSS: 基于状态值学习与循环轮换多智能体调度的客观对齐方法
多智能体合作、去中心化状态价值学习、可伸缩性、效率和最优目标的识别与对齐是本研究的关键内容。
PDF3 months ago
我们选择去太空：人与多机器人在失重状态下的代理驱动协作
SpaceAgents-1 系统在微重力环境下学习人机和多机器人协作策略，通过开发微重力模拟环境和引入分层异构多机器人协作架构，解决了地面实验室中获得熟练机器人技能和在微重力条件下进行高效协作的难题。
PDF4 months ago
LongAgent: 通过多智能体协作将语言模型扩展至 128k 上下文
通过多智能体协作的方法，我们提出了一种名为 LongAgent 的方法，将大型语言模型（例如 LLaMA）的上下文窗口扩展到 128K，并在长文本处理方面展示了相对于 GPT-4 的潜在优势。LongAgent 中，一个领导者负责理解用户意
PDF5 months ago
合作行动：探索阿瓦隆游戏中的语言代理用于即时团队合作
我们的研究关注于自然语言驱动的环境中的多代理协作问题，通过对 LLM 代理的研究，我们发现了 LLM 代理在团队协作中的潜力，并指出了与交流中的幻觉相关的问题。为了解决这个问题，我们开发了 CodeAct，一种具备增强记忆和代码驱动推理功能
PDF6 months ago
通过多智能体同行评审协作实现大型语言模型的推理
通过多模型协同合作策略，模拟学术同行评审过程的多个代理人独立构建解决方案，相互审查并分配评审置信度，最终通过反复修订得到优于现有方法的结果，在多个推理任务中展示出卓越的准确性，并在数学推理中体现了对评审置信度整合的有效性，为模仿人类的多代理
PDF8 months ago
MindAgent：新兴游戏互动
我们提出了一种新型基础设施，名为 MindAgent，用于评估游戏交互中的规划和协调能力，并引入了新的游戏场景和相关基准，以评估多智能体协作效率。我们使用新的自动度量 CoS 进行全面评估。我们希望我们对大型语言语料库学习的 LLMs 以及
PDF10 months ago
迈向因果 GPT：基于多智能体方法的忠实知识推理，通过提升 LLMs 中的因果一致性
基于多智能体协作的框架提高知识推理的真实性和因果性，并在各类知识推理任务中优于其他最先进方法。
PDF10 months ago
MM多智能体注意力演员 - 评论家算法在蜂窝网络负载平衡中的应用
本文研究了在蜂窝网络中，基站之间的负载均衡问题，提出了一种鲁棒的多智能体协作算法，使用马尔科夫博弈建模并采用自我注意力机制和两种类型的方案来平衡活跃 UE 和空闲 UE 的负载。通过大量模拟实验，与现有 MARL 方法相比，该方案的整体性能
PDFa year ago
AAAI基于知识和数据的异构团队合作推理和学习
本研究提出了一种应用于团队协作的体系结构，通过结合基于知识的和基于数据驱动的推理和学习，能够实现协作对象的行为预测、适应性、透明性和更好的性能。
PDF2 years ago
香草策略梯度法被忽视了吗？分析 Hanabi 的深度强化学习
通过分析多智能体合作卡牌游戏 Hanabi 基准测试中的几种在线策略深度强化学习算法，我们的研究表明，Vanilla Policy Gradient 在多个随机种子下在简化环境中表现优于 PPO，这是一个反直觉的发现。我们分析了这种行为，并
PDF2 years ago
学习推断嵌入信仰的交流
本研究介绍了一种名为意图嵌入通信（IEC）的新算法，能够模仿多智能体学习语言的能力，并通过耦合进化学习来加快学习速度，并在三种协作场景下表现出比 MADDPG 等基线更优异的性能表现。
PDF2 years ago
AAAI分散合作匪徒团队中的合作伙伴感知算法
通过在多智能体协作中引入 Partner-Aware 策略，我们提出了一种去中心化的多臂赌博问题并进行了分析，理论和实验表明该策略实现了对数遗憾，并且能够在人工智能和人机合作中获得较好的表现。
PDF3 years ago
具备场景先验知识的多智能体具身视觉语义导航
本文提出了一种基于多智能体协作的视觉语义导航方法，通过分层决策框架、场景先验知识和通信机制，可以使多个机器人协同完成探索任务，并在测试实验中表现出与单一智能体模型相比更高的准确性和效率。
PDF3 years ago
CVPR双体问题：协同视觉任务完成
本研究探讨了多智能体协作在视觉丰富的环境中的视觉学习问题，实现了在 AI2-THOR 中从像素级开始学习协作任务，并展示了显式和隐式通信对于实现视觉任务的好处。
PDF5 years ago