BriefGPT.xyz
Ask
alpha
关键词
non-cooperative games
搜索结果 - 2
利用非凸博弈中的隐藏结构以达到纳什均衡点的收敛
该研究提出了一种名为预条件隐藏梯度下降(PHGD)的灵活的一阶方法,旨在利用机器学习中隐藏的凸结构以实现收敛到均衡状态。研究对非合作博弈、Nash 均衡和控制变量与凸结构之间的转换提供了明确的收敛率保证。
PDF
6 months ago
凹函数 $N$ 人博弈中的赌徒学习
研究了非协同凹性博弈中以赌徒反馈为学习手段的长期行为,证明了采用镜像下降算法的不懊悔学习算法在满足标准单调性条件下能以概率 1 收敛于 Nash 均衡,并推导出了其收敛速率的上界。
PDF
6 years ago
Prev
Next