通过启发式多智能体规划优化智能体协作

Jan, 2023

通过启发式多智能体规划优化智能体协作

Optimizing Agent Collaboration through Heuristic Multi-Agent Planning

Nitsan Soffair

TL;DR本文提出一种新的算法解决 QDec-POMDP 问题中涉及不同类型感知智能体的问题，当其中一个智能体无法采取感知行为，但另一个智能体可以采取时，要求智能体采用相同的计划。结果表明，该算法在这些情况下比 QDec-FP 和 QDec-FPS 算法表现好得多。

Abstract

The SOTA algorithms for addressing qdec-pomdp issues, qdec-fp and qdec-fps, are unable to effectively tackle problems that involve differe

qdec-pomdp qdec-fp qdec-fps sensing agents algorithm

发现论文，激发创造

使用深度强化学习启发式方法解决协作 Dec-POMDP 问题

SA2MA 算法通过在第一阶段解决单智能体问题并获得策略，在第二阶段使用单智能体策略解决多智能体问题，能够在复杂智能体合作域中具有明显优势。

Nov, 2022

使用多智能体 A* 近似求解 Dec-POMDP

我们提出了一种基于 A * 算法的有限时域 Dec-POMDPs 策略计算方法，目标是以可扩展性为代价来牺牲最优性，在较大的时域内取得竞争性性能，主要特点是使用聚类的滑动窗口内存、修剪 A * 搜索树以及使用新颖的 A * 启发式策略。我们的实验结果显示与最先进的方法相比有竞争力的性能，并且在多个基准测试中取得了更优异的表现。此外，我们还提供了一种基于 A * 算法的找到最优值上界的方法，适用于长时域问题。主要特点是定期揭示状态的新启发式方法，从而限制可达置信度的数量。我们的实验证明了该方法的有效性和可扩展性。

May, 2024

部分可观察马尔科夫博弈中多目标自组织追捕问题研究

该研究提出了一个基于多代理系统的分布式自组织搜索和追踪框架，其中智能代理协同追踪多个动态目标。使用模糊自组织协同共进化（FSC2）算法解决了多目标自组织搜索（SOS）、分布式任务分配和分布式单目标追踪三个方面的挑战。实验表明，该框架可以有效处理具有内在部分观测和分布式决策制定的问题，实现高达近 100％的成功捕获率。

Jun, 2022

MAA*: 解决分散式 POMDPs 的启发式搜索算法

本文介绍了多智能体 A*（MAA*），这是第一种完整的和最优的启发式搜索算法，可用于解决具有有限时间视野的分散式部分可观测马尔可夫决策问题（DEC-POMDP）。该算法适用于在随机环境中操作的合作代理组的最优计划的计算，例如多机器人协调、网络流量控制或分布式资源分配。

Jul, 2012

多智能体采样式运动规划的分解

为了解决多体智能系统中路径规划难度增大的问题，我们将分解概念引入了取样算法中，并且在寻找解决方案的过程中，通过分解启发式方法将不同的智能体子集分解到独立的低维搜索空间，成功将搜索空间维度增长从指数级减少到线性级别。

Apr, 2023

分散式多智能体主动搜索和追踪：当目标超过智能体数量

多智能体多目标追踪问题中的去中心化、主动搜索和跟踪以及异步智能体通信的解决方案 DecSTER，在目标数量超过智能体数量的情况下，通过使用概率假设密度滤波器的顺序蒙特卡罗算法进行后验推断，并结合汤普森采样进行智能体的分散决策。通过比较不同的动作选择策略，在模拟中证明了 DecSTER 算法在面对不可靠智能体通信时的鲁棒性，并在不同目标数量和团队规模下优于信息贪婪基准的优化子模式分配 (OSPA) 指标。

Jan, 2024

一种策略共鸣方法解决多智能体强化学习中的责任扩散问题

本文分析了多智能体强化学习算法中可能出现的协作失败问题，并提出了一种 “策略共鸣” 方法来解决此问题，并证明了该方法对于提高智能体在复杂协作任务中的性能是有效的。

Aug, 2022

联合度量很重要：轨迹预测的更好标准

本文针对轨迹预测的常见问题，首次全面评估了最新的预测方法，提出并优化了基于联合度量的新损失函数，可以显著提高以前的最佳表现，并在交互建模方面显著改进，结果基于 ETH/UCY 和 Stanford Drone 数据集提供了证明。

May, 2023

通过利用在线生成的经验，加速多机器人操作的搜索规划

通过利用冲突基础搜索算法的重复和增量特性，加速搜索算法的方法使其适用于多臂协调和复杂环境中的机器人操作，从而达到完整和有界的次优性保证。

Mar, 2024

FMAP: 分布式合作多智能体规划

这篇论文提出了 FMAP（Forward Multi-Agent Planning），这是一种完全分布式的多智能体规划方法，它结合了规划和协调，并通过前向链式部分排序规划器在代理商联合探索计划空间，然后应用隐私模型进行通讯。实验表明，FMAP 是一种通用方法，能够高效地解决紧密耦合的领域问题和普遍问题，并且在解决国际计划竞赛基准的复杂规划任务方面优于当前 MAP 系统。

Jan, 2015