BriefGPT.xyz
大模型
Ask
alpha
关键词
coarse correlated equilibria
搜索结果 - 3
独立功能逼近的强化学习与马尔可夫博弈:在局部访问模型下改进的样本复杂度界限
学习大状态和动作空间中的均衡、克服多项机构所带来的麻烦是一个具有挑战性的问题,最近的研究尝试通过使用独立的线性函数类来逼近每个代理的边际 Q 值来解决这个问题。我们介绍了一种新算法 Lin-Confident-FTRL,用于学习具有本地对模
→
PDF
4 months ago
正则化学习下游戏中动态稳定性和战略稳定性的等效性
通过研究正则化的无悔学习方法在有限游戏中的长期行为,我们发现玩家的实际策略如何随时间演变的理解非常有限,同时发现只有严格纳什均衡是稳定吸引的,进而揭示了玩家的日常对策的集合有理性的特性。我们进一步刻画了相应集合的稳定和收敛速率,并表明基于熵
→
PDF
8 months ago
通过函数逼近证明的高效去中心化多智能体强化学习
提出了第一种能够在分布式系统下使用函数逼近算法解决多代理强化学习的方法,此算法总能输出马尔可夫序列最优解,并且实现了根据多样性相关均衡(CCE)找到Ɛ- 最优解的最优速率,同时,还提出了一种能够在多样性相关均衡(CCE)中找到策略类受限一致
→
PDF
a year ago
Prev
Next