Jul, 2023

利用对称先验进行多智体强化学习

TL;DR本文提出了一个框架,通过整合数据增强和良好设计的一致性损失,利用先前的知识来改善现有的多智能体强化学习方法,该框架适用于大多数现有的多智能体强化学习算法,并在多项具有挑战性的任务上进行了实验验证其有效性,同时在物理多机器人测试平台上证明了该框架的优越性。