Sep, 2024

集中训练与分散执行在合作多智能体强化学习中的介绍

TL;DR本文研究了合作多智能体强化学习中的集中训练与分散执行(CTDE)方法,解决了现有方法在执行时需依赖本地信息的问题。通过介绍CTDE的基本概念和常用方法,强调其在合作场景中的自然适用性,本文的核心发现是CTDE可以在不需要执行阶段通信的情况下,提升智能体的可扩展性和性能。