May, 2025
通过层次共自游玩掌握多无人机排球
Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play
Reinforcement Learning
TL;DR本文解决了3v3多无人机排球游戏的学习问题,这是一项新颖的具身竞争任务,要求高水平的战略协调和低级的灵活控制。我们提出了一种层次化的共自游玩框架(HCSP),划分了集中化的高层战略决策与分散化的低层运动控制。实验表明,HCSP的表现优于非层次化自游玩和基于规则的层次化基线,平均赢率达到82.9%。