有限感性合理性理论

Jul, 2023

A Theory of Bounded Inductive Rationality

Caspar Oesterheld, Abram Demski, Vincent Conitzer

TL;DR本文提出一种不需要假定逻辑全知的有限理性归纳代理理论，要求有限理性归纳代理无限次地测试每个高效可计算的假设，然后遵循那些能够实现高奖励的假设。同时，探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。

Abstract

The dominant theories of rational choice assume logical omniscience. That is, they assume that when facing a decision problem, an agent can perform all relevant computations and determine the truth value of all r

rational choice logical omniscience bounded rationality inductive agents strategic interactions

发现论文，激发创造

有限理性代理人的决策制定

通过将有限理性概念与信息论观点相结合，将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动，模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。

Oct, 2022

信息论有界理性

本文提出了基于信息理论思想的有限理性理论，并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策，扩展后得到的类别决策问题非常广泛，包括古典决策规则等极限情况以及可信和风险敏感规划。

Dec, 2015

一种面向分层决策系统专业化的信息论在线学习原理

研究信息 - 理论有限理性的决策者组合问题，并提出了一种基于在线学习规则的问题空间的分区方案，旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类，回归，强化学习和自适应控制等领域。

Jul, 2019

自动化机器学习、有限理性和合理元推理

这篇论文从有限理性的角度出发，将 AutoML 工具视为一个快速训练给定数据集模型的代理，并探讨了如何在元层面上寻找适当的 ML 管道的问题。

Sep, 2021

算法理性：代价计算的博弈论

本文提出了一个关于战略代理进行可能昂贵计算的普适的博弈论框架，利用该框架在一些已研究的博弈中（如有限重复犯罪囚徒困境和剪刀石头布）提供心理学上合理的解释，同时提出了保证博弈中存在均衡的自然条件。

Dec, 2014

计算理性化：逆平衡问题

该文介绍了一种在多智能体领域应用的、基于逆优化控制、遗憾和最大熵原理的方法，用于预测与推广多智能体的行为，并恢复其奖励函数。

Mar, 2011

逻辑非全知问题的形式化方法

该研究提出了适用于可计算算法的逻辑归纳准则，该准则为每个给定形式语言中的逻辑语句分配概率并随时间逐步细化，并通过股票交易类比进行了概述。这一准则可以推导出一些有利的有界理性推理者的特性。

Jul, 2017

在计算资源限制下推理信念和行动

讨论在计算能力不足时使用替代逼近过程和启发式方法以及使用用户效用结构对推理进行量身定制来平衡部分结果的成本和收益的应用决策理论来解决困难问题的解决方案。

Mar, 2013

反思神谕：经典博弈论的基础

该论文提出一种 “反思性” Oracle 的类型，该类型可用于定义使用因果决策理论的理性代理。这可以被视为为经典博弈论提供基础，其中玩家不是特殊的，并且它们相互作用将发挥纳什均衡。

Aug, 2015

有限时间下的人类决策

通过统计力学和信息论的思想，实验测试了资源限制下有限理性决策的正式化预测，并将该模型参数分解为受试者预期效用函数和资源参数，结果显示人类在面对资源限制时逐渐回退到他们学习的先前选择模式。

Oct, 2016