CoAct:自主代理协作的全局 - 本地层级
我们的研究关注于自然语言驱动的环境中的多代理协作问题,通过对 LLM 代理的研究,我们发现了 LLM 代理在团队协作中的潜力,并指出了与交流中的幻觉相关的问题。为了解决这个问题,我们开发了 CodeAct,一种具备增强记忆和代码驱动推理功能的通用代理,使其能够再利用部分信息以快速适应新团队成员。
Dec, 2023
我们提出了一种新颖的多机器人协作方法,利用预训练的大型语言模型(LLMs)进行高层通信和低层路径规划,通过机器人之间的交流和集体推理任务策略,并生成子任务计划和任务空间路径,应用于多臂运动规划,以加速轨迹规划,并在环境中提供反馈,如碰撞检测,以促使 LLM 代理改进其计划和路径点。我们提出了 RoCoBench,一个包含六个任务的广泛多机器人协作场景的基准测试,伴随着一个纯文本数据集用于代理表示和推理。我们在实验证明了我们方法的有效性 - 它在 RoCoBench 的所有任务上都取得了高成功率,并且能够适应任务语义的变化。我们的对话设置提供了高度的可解释性和灵活性 - 在真实世界的实验中,我们展示了 RoCo 可以轻松地与人工智能交互,用户可以与机器人代理合作完成任务。请参考项目网站以观看视频和获取代码。
Jul, 2023
该研究介绍了使用大型语言模型在多智能体协调方面的有效性评估,构建了 LLM-Co 框架来使 LLMs 能够进行协调游戏,并展示了 LLMs 在不同方面的评估结果,从而强调了 LLMs 在复杂协调环境中的潜力。
Oct, 2023
在全面自主的机器人系统领域,本研究通过提出系统架构来解决复杂开放世界环境中任务与动作规划的挑战,核心是处理生成计划中的物理、逻辑和语义错误的重规划策略。通过在仿真和两个复杂的现实场景中进行实证评估,我们展示了所提出的反馈架构对可执行性、正确性和时间复杂性的有效性。
Oct, 2023
应用大型语言模型(LLMs)在各种任务和社会模拟中取得了显著进展,但它们在任务导向的社会背景中的协调能力尚未得到充分探索。为了弥合这一差距,我们引入了协作生成代理,为基于 LLMs 的代理赋予一致的行为模式和解决任务的能力。我们将这些代理置于一个模拟的招聘会环境中进行案例研究,以审查它们的协调能力。我们提出了一个新颖的框架,赋予协作生成代理人类般的推理能力和专业技能。我们的评估结果表明,这些代理显示出有希望的性能。然而,我们也发现了限制,阻碍了它们在更复杂的协调任务中的效果。我们的工作对于 LLMs 在任务导向的社会模拟中的作用和发展提供了有价值的见解。
Oct, 2023
使用名为 ReAct 的方法,在大型语言模型中交错生成推理迹线和任务特定的操作,以促进两者之间的协作,从而在多项语言理解和决策任务中提高其有效性,同时优于缺乏推理或行为组件的方法。
Oct, 2022
基于大型语言模型的人机协作研究旨在解决 LLM 智能代理在适应动态环境和完全理解人类需求方面的不足,在此工作中,我们介绍了复杂任务解决中基于 LLM 的人机协作问题,并提出了一种基于强化学习的人机协作方法 ReHAC,该方法通过策略模型确定人类干预的最佳时机,为此我们构建了一个供离线强化学习环境训练该策略模型的人机协作数据集,验证测试结果证实了模型的有效性,研究结果表明,人类和 LLM 智能代理的协同努力通过精心计划的有限人类干预显著提高了复杂任务的性能。数据集和代码可在此链接获取:this https URL
Feb, 2024
通过引入跨团队合作(CTC)框架,实现协同的团队制定各种决策并在跨团队合作环境中进行沟通,从而提高软件开发中的质量,展示了多智能体合作的潜力和广泛适应性。
Jun, 2024