在合作语言游戏中适应队友
我们的研究关注于自然语言驱动的环境中的多代理协作问题,通过对 LLM 代理的研究,我们发现了 LLM 代理在团队协作中的潜力,并指出了与交流中的幻觉相关的问题。为了解决这个问题,我们开发了 CodeAct,一种具备增强记忆和代码驱动推理功能的通用代理,使其能够再利用部分信息以快速适应新团队成员。
Dec, 2023
通过多个大型语言模型代理,我们提出了一种新的自适应团队构建范式,其中使用名为 Captain Agent 的新型代理设计来动态形成和管理任务求解过程中的团队。在六个真实场景的全面评估中,Captain Agent 的平均准确率提高了 21.94%,无需特定任务提示工程,表现出色且具有灵活的结构化问题解决方法。
May, 2024
本研究通过多轮合作游戏验证了由社会文化背景塑造的言语间推理假设在交流中的重要性,并通过多模型预测玩家的动作,实现了对其社会文化资料的联合建模,并表明这种建模方法显著提高了与给出线索和猜测相关的任务的性能。
Jun, 2023
本文提出并考虑了合作式语言习得问题,该问题是特殊形式的临时团队协作问题,然后提出了一种概率模型,用于从观察团队语言使用者之间的沟通中推断说话者的意图和听众的语义,该模型基于说话者从事积极信号和监听器展示积极倾听的假设,并说明了可能的说话者传递正确信息的非最优能力,最后讨论了进一步测试和开发此框架的工作。
May, 2023
使用自适应带权网络模型模拟了一种命名游戏,发现通信成功率对于模型的语言分布有显著影响,当成功通信者的权重占比较大时,模型会出现多语言状态,但最终会出现一种主导语言。
Jul, 2011
本文提出了一种基于多智能体交互通信的语言学习框架,在指代游戏的上下文中研究了这种学习方法,通过联系人工智能代理人彼此通信以识别随机图像,在通过调整游戏环境来提高代理人交流的自适应语言结构,并为代理人的代码提出简单的系统,从而使其更好地恰当地通信,并能更有效地与人类沟通。
Dec, 2016
在信息不对称的情况下,开发能够制定策略并与人类合作的自主代理人是具有挑战性的,需要有效的自然语言交流。我们引入了一个共享控制游戏,两个玩家轮流共同控制一个令牌,以在不完整信息下实现共同目标。我们对一个自主代理人在此游戏中与另一位玩家(人类)的政策综合问题进行了数学建模。为了解决这个问题,我们提出了一种基于通信的方法,包括一个语言模块和一个规划模块。语言模块将自然语言消息与定义玩家意图的有限标志集之间进行翻译。规划模块利用这些标志,使用我们提出的基于不对称信息集的蒙特卡洛树搜索与标志交换算法计算策略。我们使用《夜间侏儒》作为基础的测试场景进行了这种方法的有效性评估,该场景是一个搜索和找到迷宫棋盘游戏。人类主体实验的结果表明,通过交流,玩家之间的信息鸿沟变小,合作效率提高,并减少回合数。
May, 2024
提出 COPA 框架应对动态团队组合,使用注意力机制协调教练具有全局视图和只能看到部分视图的玩家,通过分配个体策略和自适应通信方法,验证了方法在资源收集任务、救援游戏和星际争霸微观管理任务上的性能。
May, 2021
本文提出了使用深度强化学习进行训练的带有通信能力的智能体在同时进行一系列指称游戏的计算框架,证明了框架反映了自然语言中观察到的语言现象,即语言演化的复杂属性可以不依赖于复杂的语言能力而是可以从视觉感知智能体之间的简单社交交流中产生。
Jan, 2019