Jul, 2023

基于共识导向的多智能体通信的分散自适应编队

TL;DR提出了一种新的 Cons-DecAF 框架,通过使用 ConsMAC 方法进行多智能体强化学习,利用策略蒸馏实现自适应编队调整,并采用基于 Hausdorff 距离的位移式编队,取得了出色的速度和稳定性表现。