Mar, 2024

多机器人任务分配中带有学习激励函数的大图匹配加权

TL;DR该论文介绍了一种使用图强化学习 (GRL) 框架来学习多机器人任务分配 (MRTA) 的启发式或激励的方法,其中使用胶囊注意力策略模型来学习如何赋予任务 / 机器人配对 (边) 在将任务集与机器人集连接的二分图中的权重。该方法与使用专家指定启发式的原始二分图匹配方法性能相当,但具有显著的鲁棒性优势。在训练过程中,学到的激励策略与专家指定的激励策略初始接近,然后稍微偏离其趋势。