我们引入了神经均衡求解器,它利用特殊的等变神经网络体系结构来近似解决具有固定形状、购买速度和决定性的所有游戏空间,并定义了一个灵活的均衡选择框架,该框架能够唯一选择最小化相对熵或最大化福利的均衡,该网络的训练无需生成任何监督训练数据,展示了在更大的游戏中惊人的零样本泛化能力。这样的网络是许多可能的多主体算法的强大组成部分。
Oct, 2022
通过使用已有的等变体系结构,我们在构建神经过程中使用近似等变性的方法,证明了该模型在合成和真实回归实验中的有效性。
Jun, 2024
在非凸博弈中,通过在线梯度下降和无悔学习等方法可以有效地收敛到具有光滑效用函数的博弈中的局部均衡状态。
Mar, 2024
通过采样策略和马尔科夫蒙特卡罗方法,提出了一种基于多项式更新算法的广义博弈相关均衡计算方法,用于在多智能体系统中更高效的计算关于社会福利的均衡。
May, 2012
通过对对称性的任务特定归纳偏差的明确合并,机器学习模型的高性能设计准则已经出现。
May, 2023
本文提出了一种新的算法方法来解决优化一些目标(如社会福利)的相关均衡问题,并且给出了一种适用于所有紧凑表示的足够条件,同时利用该算法方法将最优 CE 问题转化为调整偏差的社会福利问题,这个框架可以识别出新的类别的博弈,其中包括基于树图的图形多项式博弈。同样使用类似的方法,我们导出了一种足够的条件来处理最优粗糙相关均衡问题,并使用其证明了单例拥塞博弈的可跟踪性。
Sep, 2011
通过发展更高效和可扩展的算法,使用稀疏迭代方法的行为扰动来解决不完全信息博弈中的纳什均衡问题,从而实现最优均衡,但不排除博弈树中未到达的子树中存在次优策略。 通过使用平滑方法,能够计算出一个近似的 extensive-form 完美均衡,以解决经典的纳什均衡算法中存在的精度问题。
May, 2017
本文介绍了关于粗略相关均衡的研究,讨论了算法和动态模型在多人博弈中的适用性,并给出了相应的数学模型和贡献。
Apr, 2015
本文研究如何在大型零和博弈中计算近似纳什均衡,提出两种方法:无悔在线学习和基于凸凹点公式的梯度方法,并尝试将两种方法进行整合。
Nov, 2014
本研究探讨深度神经网络通过对隐含凸函数的 Proximal 操作构建 Optimization Induced Equilibrium Networks (OptEq) 的平衡点是否能作为优化问题的解,进而引入先验属性以便优化设计深度模型。该研究发现优化辅助设计的 OptEq 优于以往的隐式模型,是设计深度模型的重要一步。
May, 2021