May, 2023
Google研究足球多智能体场景的实证研究
An Empirical Study on Google Research Football Multi-agent Scenarios
TL;DR本文提供了一个基于群体的多智能体增强学习(MARL)训练流程和超参数设置,用于提高11v11场景下的足球AI性能,这是一个新的开放基准,在200万步内从零开始击败了难度为1.0的机器人,并介绍了Independent Proximal Policy Optimization(IPPO)的预期性能,同时开源了Light-MALib训练框架和各种预训练策略。