一种贝叶斯优化方法来寻找纳什均衡
这篇论文研究了学习在黑盒游戏中的挑战,其中底层效用函数对任何代理都是未知的。通过实证查询的形式,我们提供了一种利用高斯过程来识别这类游戏中平衡点的无悔学习算法。我们的方法不仅确保了理论上的收敛速率,还通过实验验证在各种游戏中的有效性。
May, 2024
本文提出了一种用于计算竞争性双人游戏纳什均衡的新算法,该算法基于正则化双线性局部逼近的纳什均衡,避免了交替梯度下降中出现的振荡和发散,而且在达到指数级 (局部) 收敛性的同时,其收敛和稳定性的性质对于玩家之间的强交互是稳健的,具有更快的收敛速度。
May, 2019
提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡,该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题,并通过迭代解决。
Dec, 2019
采用拟贝叶斯优化的框架,通过利用简单的局部回归和随机化先验构建来量化不确定性,并保证收敛性,有效地优化高维度的综合实验、超参数调整和机器人应用的例子中胜过最先进的基准测试。
Oct, 2023
本文研究了具有竞争性的马尔可夫游戏中的 Nash 均衡学习,使用了一种新的无模型方法找到近似 Nash 均衡,其中策略 - ε 对应性和状态至 ε- 最小策略是用神经网络表示的。在动态价格领域,可以学习到近似的 Nash 均衡。
Jul, 2022
本文探讨了机器学习中一种使用高斯过程对困难或昂贵评价的未知函数进行优化和集成的贝叶斯方法,并将其扩展以利用来自未知函数的导数信息,通过采样推断来融合超参数的不确定性,并且介绍了克服之前梯度增强高斯过程的 singularity 问题的技术。结果表明,利用导数信息可以在贝叶斯优化和数值积分问题中提供显着的优化性能。
Mar, 2017
通过发展更高效和可扩展的算法,使用稀疏迭代方法的行为扰动来解决不完全信息博弈中的纳什均衡问题,从而实现最优均衡,但不排除博弈树中未到达的子树中存在次优策略。 通过使用平滑方法,能够计算出一个近似的 extensive-form 完美均衡,以解决经典的纳什均衡算法中存在的精度问题。
May, 2017
本文介绍了一种基于逆优化及变分不等式理论的数据驱动方法,用于估计在平衡模型中难以估计的参数,包括游戏中玩家的收益函数和道路网络中的拥挤函数,并使用统计学习方法进行参数化和非参数化估计。经过计算实验,结果表明该方法能够有效地估算出未知的需求或拥挤函数,并且我们提出的正则化技术大大提高了我们估算器的外样性能。
Aug, 2013