Apr, 2024

ROMA-iQSS: 基于状态值学习与循环轮换多智能体调度的客观对齐方法

TL;DR多智能体合作、去中心化状态价值学习、可伸缩性、效率和最优目标的识别与对齐是本研究的关键内容。