本文研究了无约束在线线性优化博弈中最小化后悔的算法,其中对于一个有界比较器集合,得到了该博弈的解及其渐进行为,同时针对更宽松的惩罚函数提出了相应的算法并得到了渐进解。
Feb, 2013
利用多阶梯度下降上升算法解决机器学习中非凸场景下最小最大鞍点问题,给出了基于 Polyak-Lojasiewicz 条件的算法和 Concave 最大玩家目标函数的算法,并在 Fashion-MNIST 数据集上进行公平分类实验。
Feb, 2019
本文提出了一种用于计算竞争性双人游戏纳什均衡的新算法,该算法基于正则化双线性局部逼近的纳什均衡,避免了交替梯度下降中出现的振荡和发散,而且在达到指数级(局部)收敛性的同时,其收敛和稳定性的性质对于玩家之间的强交互是稳健的,具有更快的收敛速度。
May, 2019
提出了一种使用单一目标凸优化工具构建适用于各种问题的线性下界,特别是在n个玩家可微分对抗博弈中使用谱方法得到了线性下界。
Jun, 2019
本文研究了一类非凸非凹的极小极大博弈,应用于生成对抗网络中。作者从优化理论、博弈理论和动态系统的角度展开分析,证明了针对特定的问题实例,梯度下降升力动力学可能表现出多种不收敛至极小极大解的行为,包括周期性和波恩卡雷复发。
Oct, 2019
本文提出了一种基于加速的近端点方法和最小值近端步求解器的算法,其梯度复杂度为O(kappa_x kappa_y^0.5),匹配了已有的最优下界,可用于解决强凸强凹、凸凹、非凸强凹和非凸凹函数的问题。
Feb, 2020
研究无穷时间折扣二人零和马尔可夫博弈,开发了一种分散算法,自我对弈时能够收敛到Nash均衡点。
Feb, 2021
研究了凸优化问题,提出了基于无遗憾游戏动力学的算法框架,并讨论了多种无遗憾学习算法的选择策略及其拥有的收敛性质,证明了很多经典的凸一阶方法都可以被理解为该框架的特殊情况,并且提出了一些之前未被发现的用于特殊凸优化问题的一阶方法。
Nov, 2021
本文提出了一种用于在马尔可夫博弈中寻找纳什均衡的新方法,该方法结合梯度下降和熵正则化,获得了更好的收敛性能,并证明了该算法在合适的正则化参数选择下可以收敛到原问题的纳什均衡。
May, 2022
我们研究了解决度量空间中的极小-极大问题的两种变体的镜像下降-上升算法:同时和顺序。在满足凸凹性和支付函数相对平滑性的假设下,我们通过平测度上合适的Bregman散度定义,展示了收敛速度到混合纳什均衡的大小,以Nikaido-Isoda误差为度量,对于同时和顺序的方案分别为O(N^(-1/2))和O(N^(-2/3)),这与相关有限维度算法的最新结果一致。
Feb, 2024