本文提出一种不需要假定逻辑全知的有限理性归纳代理理论,要求有限理性归纳代理无限次地测试每个高效可计算的假设,然后遵循那些能够实现高奖励的假设。同时,探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。
Jul, 2023
讨论在计算能力不足时使用替代逼近过程和启发式方法以及使用用户效用结构对推理进行量身定制来平衡部分结果的成本和收益的应用决策理论来解决困难问题的解决方案。
Mar, 2013
本文旨在分析和提出可扩展的算法,以计算正常形式和广义形式下对量化对手的有效和稳健策略,通过对量化对手的剥削,定义了两种解决方案,分析了它们的特性,并证明了计算这些解决方案是计算上困难的,因此我们评估了几种基于可扩展的对偶后悔最小化的启发式近似方法,并且鉴别了比先前使用的变体更好地利用有界对手的 CFR 变体,同时被最坏情况的完全理性对手所利用。
Sep, 2020
通过适应性算法的考虑以确保比修改行为所能达到的结果更好,我们可以基于相关学习动态产生新的博弈理论分析,这样做比基于平衡策略算法更加有效,因为前者可以处理非零和多人博弈问题。我们重新审视了博弈理论中的中介均衡和偏差类型,证明了没有可行的概念包含所有其他类型,并引出了一个追溯与规避策略算法的平衡类别的定义。
Dec, 2020
本文综合从理论和实证的角度,回顾了计算有限正规形式博弈中纳什均衡及其近似解的各种算法,并在不同类型的博弈中对这些算法进行了综合比较,并给出了关于这些算法的实现和使用的实际建议,最后从理论和实践考虑提出了一系列开放问题。
Dec, 2023
该论文从理论的角度考虑了安全博弈,并提供了各种安全博弈模型的统一视角。研究发现,安全博弈的复杂性在本质上由集合系统 E 确定。
Mar, 2016
该文介绍了一种在多智能体领域应用的、基于逆优化控制、遗憾和最大熵原理的方法,用于预测与推广多智能体的行为,并恢复其奖励函数。
Mar, 2011
本文提出了基于信息理论思想的有限理性理论,并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策,扩展后得到的类别决策问题非常广泛,包括古典决策规则等极限情况以及可信和风险敏感规划。
Dec, 2015
本文研究了基于局部知识来学习研究各种类型的博弈及其均衡求解的复杂度,探讨了计算学习模型和对于各种博弈的查询复杂度,着重研究了对称网络拥塞博弈,并通过仅查询少量的纯策略来学习成本函数。
Feb, 2013
通过赋予智能体风险厌恶和有限理性等人类决策要素,我们展示了一类风险厌恶量子响应均衡解(Risk-Averse Quantal Response Equilibria,RQE),不依赖于底层游戏结构而只依赖于智能体的风险厌恶程度和有限理性,在所有 n 个玩家矩阵和有限时域马尔可夫博弈中可以高效计算。此外,我们还通过实证经济学研究所涉及的许多两人矩阵游戏验证了这类解集的丰富性,并对在有生成模型的有限时域马尔可夫博弈中计算这些均衡的样本复杂度进行了首次分析,同时在简单的多智能体强化学习基准测试中验证了我们的发现。
Jun, 2024