- 因果图 ODE:多智能体动态系统的连续处理效果建模
通过使用图神经网络 (GNN) 作为普通微分方程 (ODE) 函数,我们提出了因果图普通微分方程 (CAG-ODE) 模型,该模型能够捕捉多个代理间的连续交互,并学习时间相关的处理表示,从而实现对潜在结果的准确预测。通过引入两个域对抗学习目 - 数字孪生的保守和风险意识离线多智能体强化学习
提出了一种适用于基于数字孪生的无线网络的离线多智能体保守分位回归 (MA-CQR) 方案,通过集成分布式强化学习和保守 Q 学习来解决环境的内在的随机性不确定性和数据有限性导致的认识不确定性。在无人机网络中应用该方案,展示了其对轨迹规划问题 - 网络上的相互作用粒子系统:网络和相互作用核的联合推断
在网络上建模多智能体系统是各种学科中的一个基本挑战。我们从由多个轨迹组成的数据中共同推断网络的权重矩阵和相互作用核,分别确定智能体之间的相互作用以及此类相互作用的规则。我们提出的估计器自然导致一个非凸优化问题,我们研究了两种方法来解决:一种 - 保证智能逻辑代理在可信与道德行为方面的表现
在这篇论文中,我们提出 / 改进 / 扩展了基于动态(运行时)逻辑的自我检测技术,以确保自主智能代理的可靠和道德行为。
- MAIDCRL:半中心化多智能体影响密集 CNN 强化学习
分布式决策,多智能体系统,强化学习,智能体影响图和多智能体控制是本论文的主要研究内容。
- 一个用于协同多智能体系统的信任因子图模型
该研究通过引入因子图的新图形方法,揭示了多智能体系统中代理之间的行为和可信度关系,并提出了一种分散式评估可信度的方法,以考虑接近安全、一致性和合作等关键因素,验证了该方法在无信号交叉口中自主导航的模拟和实证测试中的有效性。
- LLM 多智能体系统:挑战和开放问题
该论文探讨了多智能体系统中存在的问题,并提出了挑战。通过充分利用多智能体系统中个体智能体的多样能力和角色,这些系统可以通过协作来处理复杂任务。我们讨论了任务分配的优化,通过迭代辩论来促进强大的推理能力,管理复杂且分层的上下文信息,并增强记忆 - 信任何人?分布式高斯过程回归的选修学习
创新地使用高斯过程回归 (GP) 在多智能体系统 (MASs) 中增强分布式合作学习的方法被介绍。该方法的关键贡献是开发了一种选择性学习算法,即先验感知式选择性分布式 GP (Pri-GP),它赋予智能体有能力根据其可信度有选择地请求邻居智 - 基于高斯过程回归的分布式事件触发在线学习,用于多智能体系统的安全共识
利用高斯过程学习补偿多智能体系统中未知的组成部分,并通过基于概率保证的预测误差边界确保了所提出的基于学习的控制器的控制性能。
- 上下文感知多智能体系统研究综述:技术、挑战与未来发展方向
综述了最新的情境感知多智能体系统,包括对情境感知系统和多智能体系统的特性进行了概述,提出了一个将不同领域的方法结合起来的情境感知系统的一般过程,并讨论了情境感知多智能体系统的现有挑战和未来研究方向。
- 多智能体系统中的推理能力:限制、挑战和以人为中心的解决方案
利用大型语言模型(LLMs)在多项任务中取得的显著表现带来了在实际环境中利用它们的许多机遇和挑战。为了实现 LLMs 的实际采用,多智能体系统在使用现有专有数据和模型应对复杂现实任务的企业平台的更大背景下,具有增强、整合和协调 LLMs 的 - 多智能体的健壮性诊断通过光明多样性
为了解决多智能体系统中训练期间过拟合的问题,本文提出了一种生成多样化对抗情景以暴露多智能体政策弱点的新方法 MADRID,并在复杂环境中进行了有效性评估,揭示了当前方法在决策制定方面的关键不足之处,强调了对多智能体系统的严格评估的重要性。
- 多智能体动态关系推理在社交机器人导航中的应用
通过系统的关系推理方法和轨迹预测,我们提出了一种适用于多智能体系统的社交机器人导航研究,通过该方法,在密集、互动场景中,在安全性、效率性和社交遵循性方面显著优于最强基准线。
- PsySafe:多智能体系统安全的心理攻守与评估的综合框架
多智能体系统结合大型语言模型 (LLMs) 展示了集体智能的显著能力,然而对于潜在的恶意使用所带来的安全问题的全面研究仍然有限。本研究基于智能体心理学提出了一个综合框架,着重于确定智能体黑暗人格特质可能导致的风险行为,设计缓解这些风险的防御 - AAAI基于内在价值驱动的合作多智能体系统的强化学习
该研究论文提出了一种层次化的复合内在价值强化学习模型(IVRL),用于描述多智能体在协作中的复杂行为。通过理性地组织个体的各种需求,研究表明群体能够以更低的成本实现更好的性能。
- 语音代理:多模式多智能体系统下的人际交流模拟
提出了一种基于多模态 LLM 的多智能体系统 SpeechAgents,用于模拟人类交流,并通过多智能体调优增强了 LLM 的多智能体能力,实验结果表明 SpeechAgents 可以具有一致的内容、真实的节奏和丰富的情感,同时在高达 25 - 探索基于大型语言模型的智能代理:定义、方法与前景
对基于大型语言模型(LLM)的智能代理进行了深入调查,涵盖了单代理和多代理系统中的定义、研究框架、组成、认知和规划方法、工具利用、对环境反馈的响应,以及在多代理系统中部署 LLM-based 代理的机制,包括多角色协作、信息传递和缓解代理之 - 基于对比学习的深度强化学习中的代理建模
多代理系统中,对智能机器代理进行适应性策略设计时,代理建模是至关重要的,通过代理建模可以理解其他代理的行为并提取有意义的策略表示,为增强自我代理的适应性策略提供帮助。这篇研究以对比学习为基础的代理建模方法(CLAM)只依赖于自我代理在训练和 - OpenRL:一种统一的强化学习框架
OpenRL 是一个先进的强化学习框架,可以适应各种任务,从单智能体挑战到复杂的多智能体系统。它与自然语言处理(NLP)集成,使研究人员能够有效地处理强化学习训练和以语言为中心的任务的组合。通过借助 PyTorch 的功能,OpenRL 展 - TESS: 分布式自然语言理解模型的交互式多智能体系统的多目标解析器
该研究提出了一种有效的解析和编排流水线算法,以满足多意图用户的需求,同时提供与竞争性深度学习模型相当的性能,并且速度可达到快速的 48 倍。