基于赌博式大邻域搜索的自适应的任意时刻多智能体路径规划

Dec, 2023

基于赌博式大邻域搜索的自适应的任意时刻多智能体路径规划

Adaptive Anytime Multi-Agent Path Finding Using Bandit-Based Large Neighborhood Search

Thomy Phan, Taoan Huang, Bistra Dilkina, Sven Koenig

TL;DR使用基于多臂赌博机的双层方案进行在线学习，该方法能够在大规模情景下比目前最优的任意时刻多智能体路径规划方法提升至少50%的成本效益。

Abstract

anytime multi-agent path finding (MAPF) is a promising approach to scalable path optimization in large-scale multi-agent systems. State-of-the-art anytime MAPF is based on large neighborhood search (LNS), where a

发现论文，激发创造

MAPP: 一种具有可行性和完整性保证的可伸缩多智能体路径规划算法

使用分散化方法，本研究引入了可操作的多智能體路徑規劃演算法(MAPP)，並經實驗證明，其比現有的FAR和WHCA*方法解決率更高。

Jan, 2014

含延迟概率的多智能体路径规划

该研究提出了一个基于Multi-Agent Path Finding (MAPF) 的两层搜索的MAPF-DP解决方案，包括规划具有不完美执行计划的有效MAPF-DP解决方案，提出了具有鲁棒性的计划执行策略以控制每个代理的行动，展示了能够生成有效MAPF-DP计划的两层MAPF-DP 求解器（称为期望值最小化近似）。

Dec, 2016

一致优先级搜索多智能体路径规划

该研究探讨优先规划在多智能体路径规划中的应用，提出了基于冲突驱动的组合搜索框架，在实验中展示了其解决方案的先进性和成功率，并首次探讨了优先规划的完整性和最优性的局限性。

Dec, 2018

二维网格上多智能体路径规划的细粒度复杂性分析

本研究通过对二维网格中时间最优多智能体路径规划的细粒度复杂性分析，揭示了新的可解性界限，并在只有两个方向时，提出了找到最优解的有效算法，从而帮助指导算法设计。

May, 2023

LaCAM$^\ast$的工程化：面向实时、大规模和近似最优的多智能体路径规划

通过改进LaCAM*的算法，本文提出了几种改进技术，以扩展多智能体路径规划算法(MAPF)，改进后的算法显著提高了解决方案的质量，进一步推动了MAPF算法的发展。

Aug, 2023

学习跟随：基于规划和学习的去中心化多智能体路径规划

在这项工作中，我们研究了分布式多智能体路径规划问题的设置，通过集成启发式搜索和强化学习方法，提出了一种解决复杂的问题的方法。我们的方法在广泛的设置中得到了验证，并且在吞吐量和泛化能力上表现优越，同时比现有的基于规则和基于搜索的解决方法快一个数量级。

Oct, 2023

分布式蒙特卡洛树搜索用于部分可观察多智体路径规划

我们提出了一种基于分布式多智能体蒙特卡罗树搜索方法的多智能体路径规划算法，通过利用智能体的观察结果重新创建内在的马尔科夫决策过程，并结合针对多智能体任务的定制化神经蒙特卡罗树搜索算法进行路径规划，实验证明该方法优于现有的学习型多智能体路径规划器。

Dec, 2023

多智能体路径规划的可扩展机制设计

我们介绍了可扩展的多智能体路径规划的机制设计问题，并提出了三种不可否认策略的机制，其中两种甚至使用了近似的多智能体路径规划算法。我们在实际应用中测试了这些机制，问题规模从几十到数百个智能体。研究结果表明，与简单基准相比，它们可以提高整体效益。

Jan, 2024

优化基于启发式搜索的学习局部MAPF策略

多智能体路径规划是解决一组智能体到达目标位置的无碰撞路径问题。先进的经典多智能体路径规划求解器通常采用启发式搜索方法以找到数百个智能体的解决方案，但通常是集中式的，而在短时间内可能难以扩展。机器学习方法学习每个智能体的策略非常吸引人，因为它们可以实现分散式系统，并在保持良好解决方案质量的同时具备良好的扩展性。我们的主要思想是，我们可以通过使用启发式搜索方法来改进机器学习的局部策略，以解决死锁和实现完全水平的规划。我们展示了几种无模型方法来使用带有学习策略的启发式搜索，这些方法显著提高了策略的成功率和可扩展性。据我们所知，我们首次证明了基于机器学习的多智能体路径规划方法在高拥塞场景（例如，20％智能体密度）中的可扩展性。

Mar, 2024

自适应延迟启发式的随时多智能体路径规划

本研究解决了当前随时多智能体路径规划（MAPF-LNS）在选择销毁启发式上耗时过长的问题。提出的自适应延迟销毁与修复方法（ADDRESS）通过限制的汤普森采样技术优化邻域生成，显著提升了大规模场景中路径优化的效率和效果，展示了在高达1000个智能体的情况下，成本至少改善了50%。

Aug, 2024