通过将有限理性概念与信息论观点相结合,将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动,模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。
Oct, 2022
本文提出了基于信息理论思想的有限理性理论,并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策,扩展后得到的类别决策问题非常广泛,包括古典决策规则等极限情况以及可信和风险敏感规划。
Dec, 2015
研究信息 - 理论有限理性的决策者组合问题,并提出了一种基于在线学习规则的问题空间的分区方案,旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类,回归,强化学习和自适应控制等领域。
Jul, 2019
这篇论文从有限理性的角度出发,将 AutoML 工具视为一个快速训练给定数据集模型的代理,并探讨了如何在元层面上寻找适当的 ML 管道的问题。
Sep, 2021
本文提出了一个关于战略代理进行可能昂贵计算的普适的博弈论框架,利用该框架在一些已研究的博弈中(如有限重复犯罪囚徒困境和剪刀石头布)提供心理学上合理的解释,同时提出了保证博弈中存在均衡的自然条件。
Dec, 2014
该文介绍了一种在多智能体领域应用的、基于逆优化控制、遗憾和最大熵原理的方法,用于预测与推广多智能体的行为,并恢复其奖励函数。
Mar, 2011
该研究提出了适用于可计算算法的逻辑归纳准则,该准则为每个给定形式语言中的逻辑语句分配概率并随时间逐步细化,并通过股票交易类比进行了概述。这一准则可以推导出一些有利的有界理性推理者的特性。
Jul, 2017
讨论在计算能力不足时使用替代逼近过程和启发式方法以及使用用户效用结构对推理进行量身定制来平衡部分结果的成本和收益的应用决策理论来解决困难问题的解决方案。
Mar, 2013
该论文提出一种 “反思性” Oracle 的类型,该类型可用于定义使用因果决策理论的理性代理。 这可以被视为为经典博弈论提供基础,其中玩家不是特殊的,并且它们相互作用将发挥纳什均衡。
Aug, 2015
通过统计力学和信息论的思想,实验测试了资源限制下有限理性决策的正式化预测,并将该模型参数分解为受试者预期效用函数和资源参数,结果显示人类在面对资源限制时逐渐回退到他们学习的先前选择模式。
Oct, 2016