BriefGPT.xyz
Ask
alpha
关键词
differentiable games
搜索结果 - 4
ICML
可微博弈的线性下界与条件数
提出了一种使用单一目标凸优化工具构建适用于各种问题的线性下界,特别是在 n 个玩家可微分对抗博弈中使用谱方法得到了线性下界。
PDF
5 years ago
梯度基方法在全谱游戏中的紧密一致分析
通过分析梯度方法在达到纳什均衡时的线性收敛特性,证明了变异梯度方法在双线性博弈和强单调性博弈中的各种表现,并发现了这些方法在极端情况下收敛机制的差异。同时证明了变异梯度可以在任意外推次数的情况下实现优化率,一个广泛算法类别的最佳值
PDF
5 years ago
可微分游戏中的稳定对手塑造
该论文提出了稳定对手塑造方法,该方法通过插值实现了区分对手学习(LOLA)和稳定对手塑造的最佳属性,并在可微分游戏中表现出卓越的性能。
PDF
6 years ago
提升游戏动力学的负动量
本文分析了基于动量的梯度下降法在线性游戏中的应用,证明交替更新比同时更新更加稳定。同时,理论和实验都表明带有负动量项的交替梯度下降法能够实现在困难的攻击问题和难以训练的 saturating GANs 中的收敛。
PDF
6 years ago
Prev
Next