一种贝叶斯优化方法来寻找纳什均衡

Nov, 2016

一种贝叶斯优化方法来寻找纳什均衡

A Bayesian optimization approach to find Nash equilibria

Victor Picheny, Mickael Binois, Abderrahmane Habbal

TL;DR采用 Gaussian-process 和 Bayesian optimization 框架，提出适用于 derivative-free 环境下求解游戏均衡的算法，相比传统的基于导数的算法，可以在可接受的黑盒计算成本下，可靠地求得均衡。

Abstract

game theory finds nowadays a broad range of applications in engineering and machine learning. However, in a derivative-free, expensive black-box context, very few algorithmic solutions are available to find game equilibria. Here, we propose a novel →

game theory derivative-free algorithms gaussian-process bayesian optimization sequential sampling

发现论文，激发创造

通过高斯过程在黑盒游戏中进行纳什均衡的无悔学习

这篇论文研究了学习在黑盒游戏中的挑战，其中底层效用函数对任何代理都是未知的。通过实证查询的形式，我们提供了一种利用高斯过程来识别这类游戏中平衡点的无悔学习算法。我们的方法不仅确保了理论上的收敛速率，还通过实验验证在各种游戏中的有效性。

May, 2024

竞争性梯度下降

本文提出了一种用于计算竞争性双人游戏纳什均衡的新算法，该算法基于正则化双线性局部逼近的纳什均衡，避免了交替梯度下降中出现的振荡和发散，而且在达到指数级 (局部) 收敛性的同时，其收敛和稳定性的性质对于玩家之间的强交互是稳健的，具有更快的收敛速度。

May, 2019

深度虚拟博弈对多智能体游戏中马尔科夫纳什均衡的寻找

提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡，该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题，并通过迭代解决。

Dec, 2019

大规模零和博弈均衡计算的统一视角

本文研究如何在大型零和博弈中计算近似纳什均衡，提出两种方法：无悔在线学习和基于凸凹点公式的梯度方法，并尝试将两种方法进行整合。

Nov, 2014

伪贝叶斯优化

采用拟贝叶斯优化的框架，通过利用简单的局部回归和随机化先验构建来量化不确定性，并保证收敛性，有效地优化高维度的综合实验、超参数调整和机器人应用的例子中胜过最先进的基准测试。

Oct, 2023

动态定价中 n 人马尔可夫博弈的近似纳什均衡学习

本文研究了具有竞争性的马尔可夫游戏中的 Nash 均衡学习，使用了一种新的无模型方法找到近似 Nash 均衡，其中策略 - ε 对应性和状态至 ε- 最小策略是用神经网络表示的。在动态价格领域，可以学习到近似的 Nash 均衡。

Jul, 2022

通过最小化最优响应集合的剥削度来计算平衡

本文研究了在连续游戏中计算近似 Nash 均衡的问题，并提出了一种新的准则来最小化渗透性的近似值。

Jan, 2023

利用梯度和海森矩阵在贝叶斯优化和贝叶斯积分中的应用

本文探讨了机器学习中一种使用高斯过程对困难或昂贵评价的未知函数进行优化和集成的贝叶斯方法，并将其扩展以利用来自未知函数的导数信息，通过采样推断来融合超参数的不确定性，并且介绍了克服之前梯度增强高斯过程的 singularity 问题的技术。结果表明，利用导数信息可以在贝叶斯优化和数值积分问题中提供显着的优化性能。

Mar, 2017

近似廣泛型完美均衡的平滑方法

通过发展更高效和可扩展的算法，使用稀疏迭代方法的行为扰动来解决不完全信息博弈中的纳什均衡问题，从而实现最优均衡，但不排除博弈树中未到达的子树中存在次优策略。通过使用平滑方法，能够计算出一个近似的 extensive-form 完美均衡，以解决经典的纳什均衡算法中存在的精度问题。

May, 2017

逆优化数据驱动的平衡估计

本文介绍了一种基于逆优化及变分不等式理论的数据驱动方法，用于估计在平衡模型中难以估计的参数，包括游戏中玩家的收益函数和道路网络中的拥挤函数，并使用统计学习方法进行参数化和非参数化估计。经过计算实验，结果表明该方法能够有效地估算出未知的需求或拥挤函数，并且我们提出的正则化技术大大提高了我们估算器的外样性能。

Aug, 2013