- 从单个主体到多个主体:改进交通信号控制
由于城市化进程不断加速,解决信号控制问题的重要性也日益突出。本文分析了各种现有方法,并提出了增加代理数量以减少平均旅行时间的选项。通过 2 个数据集进行了实验。结果表明,在某些情况下,多个代理的实施可以改善现有方法。至于精调的大型语言模型方 - AAAI广义形式博弈中的责任
该论文提出了一种将反事实责任和看管责任相结合的定义,阐述了责任的概念并研究了两种责任形式之间的鸿沟,表明在考虑到高阶责任时,这两种责任形式可以被规定在每种可能的情况下。
- AAAI容错离线多智能体路径规划
本文研究了多智能体的新颖图路径规划问题,旨在通过离线规划解决智能体之间的碰撞和死锁问题,使得所有正确的智能体能够到达目的地,从而建立可靠的多机器人系统。
- 自主驾驶多智能体训练的新方法
本论文提出了一种名为 Lepus 的全新方法,用于通过纯合作训练多个代理进行安全和协作控制的自主驾驶复杂场景中的控制。该方法通过共享政策网络的共享参数和多个代理的分享奖励功能来训练多个代理,从而提高了它的协作决策能力和汽车驾驶的稳定性。此外 - 一体化代理人:走向多代理人会话人工智能
本文通过探讨黑盒代理集成技术中的问题,提出了问题代理配对和问题响应配对两种技术,并利用这些技术设计出了可自动和准确集成多个商用 CAs 的可扩展系统 OFA,并介绍了用于问题响应配对的新编码器模型 MARS,在 BBAI 任务中获得了最高准 - ICLRScene Transformer: 预测多个 Agent 轨迹的统一体结构
本篇研究旨在提出一种基于遮罩策略和注意力机制的场景中多智能体行为预测模型,以解决自动驾驶中的动态环境下多种智能体之间相互作用问题,结果表明该模型在多种运动预测任务上表现出优越性和普适性。
- BACKDOORL: 一种针对竞争性强化学习的后门攻击
本文探讨了将后门攻击技术应用于多智能体强化学习系统中的可能性,并证明了在两个竞技型强化学习系统中,头部代理可以通过其自身动作触发受害代理的后门,并且当后门被激活时,受害者的获胜率下降了 17% 至 37%。
- 模糊查询注意力下的多智能体轨迹预测
本论文提出了一种通用结构来解决如交通预测、行人跟踪、路径规划等多智体场景轨迹预测的挑战,该结构采用惯性、相对运动、意图、互动等模式来模拟运动的归纳偏差,灵活地模拟不同环境中多智体之间的相互作用,并且通过一个新的关注机制实现连续值(模糊)决策 - AAAIRLCard: 纸牌游戏中强化学习的工具包
RLCard 是一个用于扑克类游戏强化学习研究的开源工具包,旨在将强化学习和非完全信息游戏联系起来,推动在多个代理、大状态和动作空间以及稀疏奖励等领域的强化学习研究。
- KDD基于多用户活动轨迹的 B2B 广告定向学习
本文介绍了利用有关团队内相关用户的全面活动轨迹来预测商业向商业产品的转化,提出了一种使用分布式活动表示法构建种子列表的方法,使用来自 Yahoo Gemini 的数据来验证本方法,证明了本方法可以将转化预测 AUC 值提升 8.8%。
- 多智能体路径规划:定义、变体和基准测试
该论文旨在通过提供统一的术语来描述常见的 MAPF 假设和目标,并指向两个 MAPF 基准,介绍了一个新的基于网格的 MAPF 基准,并试验性地证明它对当代 MAPF 算法提出了挑战。
- 多智能体分布式终身学习用于集体知识获取
本文提出了一种利用多智能体网络进行分布式的集体终身学习算法(CoLLA),通过分布式地共享学习知识,在维护本地数据隐私的同时,在多个任务上表现出更好的性能,同时提供了理论保障。
- 基于 SIPP 算法的多智能体任意角度路径规划
本文研究解决多个代理节点在 2D 空间内寻找无冲突路径的问题,并使用分离式的方法,即优先级方法来解决此问题。研究者提出了基于 SIPP 算法的新型任意角度路径规划器,用于在网格上寻找一个代理节点在动态障碍物(其他代理节点)之间移动的轨迹,并