ICMLAug, 2023
有限观测多智体强化学习与(准)效率:信息共享的福音
Partially Observable Multi-agent RL with (Quasi-)Efficiency: The Blessing of Information Sharing
Xiangyu Liu, Kaiqing Zhang
TL;DR我们研究了部分可观察随机博弈的可证明多智能体强化学习 (MARL)。我们主张利用智能体之间的信息共享,在可观察性假设的情况下构建一个近似模型来规划近似均衡,并开发了一种具有统计和计算上拟效率的部分可观察 MARL 算法。