May, 2024

公平多智体社会福利优化的无懊悔学习

TL;DR在线多智能体 NSW(Nash 社会福利)最大化问题中,我们提出了一种完全回答 NSW 作为目标的无悔公平学习是否可能的算法,并且在不同设置下得到了相应的后悔界限。