通过启发式多智能体规划优化智能体协作
SA2MA 算法通过在第一阶段解决单智能体问题并获得策略,在第二阶段使用单智能体策略解决多智能体问题,能够在复杂智能体合作域中具有明显优势。
Nov, 2022
我们提出了一种基于 A * 算法的有限时域 Dec-POMDPs 策略计算方法,目标是以可扩展性为代价来牺牲最优性,在较大的时域内取得竞争性性能,主要特点是使用聚类的滑动窗口内存、修剪 A * 搜索树以及使用新颖的 A * 启发式策略。我们的实验结果显示与最先进的方法相比有竞争力的性能,并且在多个基准测试中取得了更优异的表现。此外,我们还提供了一种基于 A * 算法的找到最优值上界的方法,适用于长时域问题。主要特点是定期揭示状态的新启发式方法,从而限制可达置信度的数量。我们的实验证明了该方法的有效性和可扩展性。
May, 2024
该研究提出了一个基于多代理系统的分布式自组织搜索和追踪框架,其中智能代理协同追踪多个动态目标。使用模糊自组织协同共进化(FSC2)算法解决了多目标自组织搜索(SOS)、分布式任务分配和分布式单目标追踪三个方面的挑战。实验表明,该框架可以有效处理具有内在部分观测和分布式决策制定的问题,实现高达近 100%的成功捕获率。
Jun, 2022
本文介绍了多智能体 A*(MAA*),这是第一种完整的和最优的启发式搜索算法,可用于解决具有有限时间视野的分散式部分可观测马尔可夫决策问题(DEC-POMDP)。该算法适用于在随机环境中操作的合作代理组的最优计划的计算,例如多机器人协调、网络流量控制或分布式资源分配。
Jul, 2012
为了解决多体智能系统中路径规划难度增大的问题,我们将分解概念引入了取样算法中,并且在寻找解决方案的过程中,通过分解启发式方法将不同的智能体子集分解到独立的低维搜索空间,成功将搜索空间维度增长从指数级减少到线性级别。
Apr, 2023
多智能体多目标追踪问题中的去中心化、主动搜索和跟踪以及异步智能体通信的解决方案 DecSTER,在目标数量超过智能体数量的情况下,通过使用概率假设密度滤波器的顺序蒙特卡罗算法进行后验推断,并结合汤普森采样进行智能体的分散决策。通过比较不同的动作选择策略,在模拟中证明了 DecSTER 算法在面对不可靠智能体通信时的鲁棒性,并在不同目标数量和团队规模下优于信息贪婪基准的优化子模式分配 (OSPA) 指标。
Jan, 2024
本文分析了多智能体强化学习算法中可能出现的协作失败问题,并提出了一种 “策略共鸣” 方法来解决此问题,并证明了该方法对于提高智能体在复杂协作任务中的性能是有效的。
Aug, 2022
本文针对轨迹预测的常见问题,首次全面评估了最新的预测方法,提出并优化了基于联合度量的新损失函数,可以显著提高以前的最佳表现,并在交互建模方面显著改进,结果基于 ETH/UCY 和 Stanford Drone 数 据集提供了证明。
May, 2023
通过利用冲突基础搜索算法的重复和增量特性,加速搜索算法的方法使其适用于多臂协调和复杂环境中的机器人操作,从而达到完整和有界的次优性保证。
Mar, 2024
这篇论文提出了 FMAP(Forward Multi-Agent Planning),这是一种完全分布式的多智能体规划方法,它结合了规划和协调,并通过前向链式部分排序规划器在代理商联合探索计划空间,然后应用隐私模型进行通讯。实验表明,FMAP 是一种通用方法,能够高效地解决紧密耦合的领域问题和普遍问题,并且在解决国际计划竞赛基准的复杂规划任务方面优于当前 MAP 系统。
Jan, 2015