- CityLight:一种面向现实世界城市规模交通信号控制协调的通用模型
交通信号控制是一项具有潜力的低成本措施,可以提高交通效率而不影响现有道路基础设施。本篇论文提出了基于增强学习的城市规模高可靠道路网络交通信号控制方法 CityLight,通过参数共享的 MAPPO 优化框架来实现多个智能体的协同控制和大规模 - 通过自动检测的共有语言表达方式,分析面对面对话中的跨说话人收敛
本研究介绍了一种自动检测共享词形构造的方法,并将其应用于参与者旨在识别没有既定标签的新颖对象的指代交流语料库,分析揭示了共享构造的使用模式与参与者在社交互动后展示的对象标记一致性程度相关的特征,从而表明自动检测的共享构造为研究对话中的参考协 - CVPR朝着变量和协调的整体语音运动生成
通过 ProbTalk 的统一概率框架,以综合协调性和可变性为核心,生成自然多样的整体语音运动,从而比现有方法在质量和数量上都实现了更高的真实度。
- COLING成功的成本共担:一种评估与学习多智能体协作指导与遵循策略的游戏
在协作目标导向的情境中,我们提出了一个具有挑战性的交互参考游戏,要求两名玩家在视觉和语言观察方面进行协调。我们展示了标准的 Proximal Policy Optimization (PPO) 设置在启发式伙伴行为的引导下能够获得较高的成功 - 多智能体协作的公平审计
多个代理进行不同任务的公平审计时,协调有时可能对审计准确性有害,而不经协调的合作通常能取得良好的结果。实证研究在真实数据集上证实了这一观察,不经协调的合作的审计准确性与协调优化抽样的结果相当。
- 多智能体深度强化学习中的联合内在动机
多智能体深度强化学习中,稀疏奖励与智能体之间的协调是挑战,本文提出了一种基于联合行为的奖励策略,并通过 JIM 方法展示了多智能体内在动机在解决需要高协调水平的任务中的重要性。
- 去中心化多 Agent 协同探索中的新颖性共享
提出一种名为 MACE 的简单而有效的多智能体协同探索方法,通过仅传递本地新奇性,代理可以考虑其他代理的本地新奇性来近似全局新奇性,并引入加权互信息来衡量代理行为对其他代理累积新奇性的影响,在后见中将其转换为内在奖励,以鼓励代理对其他代理的 - 智能城市协调的协议技术
通过几个实际应用实例,本文论证了协议技术是实现智慧城市领域协调的适当手段。
- 语义计算对组织有效性的贡献:从组织理论到基于语义建模的实践
通过在一个地方政府的复杂基础设施项目中实现和验证本体论,该研究使用语义学方法对协调与合作进行建模和增强,提出了一个包含相关依赖的鲁棒保存型细化组织模型,以及如何通过改变组织内的依赖结构来减轻协调与合作风险等实际见解。
- 无人机的分散式交通管理
通过自组织协调自主代理人,解决空中无人飞行器协调的问题,实现安全高效的空中交通流量控制。
- 基于注意力动态图的复杂协调模型
DAGMIX 是一种基于图的值分解方法,通过注意机制在训练过程中生成动态图,在大规模场景中表现出色,并在其他任务中取得了有希望的结果。
- 基于大规模决策的大型语言模型代理控制:一种演员 - 评论家方法
本研究论文提出了一种新的框架,旨在提高大规模多智能体环境中大型语言模型的协调和决策能力,通过实验证明了我们提出的方法在系统资源分配和机器人网格运输方面具有显著优势。
- 通过公共操作图整合增强多智能体协作能力
多智能体系统中,代理人之间的通信对于加强协调至关重要。本研究提出了一种多智能体协调的方法,其中每个代理人具备将其观察、行动和接收到的信息整合到一个公共操作图中并传播的能力。实验结果表明,与最先进的多智能体强化学习方法相比,基于公共操作图的训 - 基于协调方法解决旅行窃贼问题
本研究提出了一种基于协调的解决方案以提高旅行窃贼问题(TTP)求解器的性能,并通过利用循环路径在物品选择时进行协调。我们还建议一种基于机器学习的协调启发式算法,通过捕捉两种人类设计协调启发式算法的特征来进一步提高性能。最终,我们的求解器名为 - 使用分布式拍卖跟踪多个雷达的多个目标
基于去中心化和协作束拍卖,介绍了一种高度弹性的雷达协调算法,可同时跟踪多个目标,并利用最多两个雷达跟踪相同目标以提高准确性。
- 合作互动中的局部最小值驱动通讯
人机交互中的一个重要问题是何时决定通信,特别是在合作任务中;感知控制理论表明,代理能通过共享相同的意图在合作任务中协作,但对于包含局部最小值的任务,至少有一个代理在适当时刻调整意图通过适时的通信,协调动作,在复杂的搜索空间中实现全局解。
- IJCAI多智能体团队学习的更深层理解
研究团队结构在群体学习中的影响,结果显示,某些团队结构帮助代理程序学习特定角色,从而获得更有利的全局结果;然而,大型团队创建的信用分配挑战降低了协调性,导致大型团队表现不如小型团队。
- MADiff:离线扩散模型多智能体学习
本文提出 MADiff,一种基于关注力扩散模型的创新多智能体学习框架,用于模拟多智能体间的复杂协调,以发挥扩散的强大的生成能力。实验证明 MADiff 相比基线算法在各种多智能体学习任务中具有较高的性能。
- 使用大型语言模型进行反复游戏
使用行为博弈理论研究大型语言模型行为,结果显示它们在自我利益方面的表现非常出色,但在协调方面表现不佳,尤其表现出一些行为特征。
- 多智能体强化学习中基于互信息协调的变分方法
本文提出了一种新的用于多智能体强化学习的互信息框架,以实现多个智能体协调行为,并通过同时多智能体行为间的互信息来规范累积收益。将多个智能体行为间的互信息引入一个潜在变量,应用变分下界,得到了一个可处理的目标函数下界,该下界可以解释为最大熵强