Dec, 2023

基于赌博式大邻域搜索的自适应的任意时刻多智能体路径规划

TL;DR使用基于多臂赌博机的双层方案进行在线学习,该方法能够在大规模情景下比目前最优的任意时刻多智能体路径规划方法提升至少50%的成本效益。