BriefGPT.xyz
Ask
alpha
关键词
full-information feedback
搜索结果 - 1
公平多智体社会福利优化的无懊悔学习
在线多智能体 NSW(Nash 社会福利)最大化问题中,我们提出了一种完全回答 NSW 作为目标的无悔公平学习是否可能的算法,并且在不同设置下得到了相应的后悔界限。
PDF
a month ago
Prev
Next