BriefGPT.xyz
Ask
alpha
关键词
general-sum games
搜索结果 - 4
高维对手塑造的扩展
对于混合激励的多智能体环境中,通过学习对博弈对手产生影响的对手塑造方法,我们成功将其扩展到具有长期行动和长期视角的广义和博弈,提出了一个称为 Shaper 的简化版本,并证明 Shaper 在多种具有挑战性的环境中能够改善个体和整体的结果。
PDF
7 months ago
AAAI
大规模完全信息博弈中求解领导者 - 追随者均衡的函数逼近
本研究提出了一种基于神经网络的函数近似方法,应用于广义和博弈的 Stackelberg 博弈情景,以学习 Enforceable Payoff Frontier,从而实现对博弈策略的近似计算和评估。
PDF
2 years ago
广义积和博弈中的最优相关均衡:固定参数算法,难度和双向列生成
研究了针对不同类型的协同均衡的最优相关策略问题,提出了相关 DAG 表示方法和双面列生成算法来计算最优策略并探讨其复杂性分析,探究了一些新的基准博弈。
PDF
2 years ago
ICML
COLA: 具有对手感知的一致学习
通过在 LOLA 算法中引入一种方法称为 Consistent LOLA,其中学习更新功能在彼此影响时保持一致,作者在广义和游戏模型中进行了一系列实验,发现这种方法比 HOLA 和 LOLA 更容易收敛,并能够找到更加符合社会期望的解决方案
→
PDF
2 years ago
Prev
Next