有限时间下的人类决策

NIPSOct, 2016

Human Decision-Making under Limited Time

Pedro A. Ortega, Alan A. Stocker

TL;DR通过统计力学和信息论的思想，实验测试了资源限制下有限理性决策的正式化预测，并将该模型参数分解为受试者预期效用函数和资源参数，结果显示人类在面对资源限制时逐渐回退到他们学习的先前选择模式。

Abstract

Subjective expected utility theory assumes that decision-makers possess unlimited computational resources to reason about their choices; however, virtually all decisions in everyday life are made under resource constraints - i.e. decision-makers are bounded in their rationality. Here we experimentally tested the predictions made by a formalization of

bounded rationality statistical mechanics information theory combinatorial puzzles learned prior choice patterns

发现论文，激发创造

信息论有界理性

本文提出了基于信息理论思想的有限理性理论，并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策，扩展后得到的类别决策问题非常广泛，包括古典决策规则等极限情况以及可信和风险敏感规划。

Dec, 2015

热力学作为一种考虑信息处理成本的决策理论

该论文提出了一个信息论的有界理性决策模型，其中决策者在预期效用和信息处理成本之间进行权衡，被视为物理状态发生变化时的热力学机器，行为受制于自由能泛函。当忽略计算成本时，该模型还原为最大化预期效用原则。

Apr, 2012

变化环境中的有界理性决策

本文研究有限理性决策制定在考虑计算成本和期望效用之间进行权衡的过程，并探讨它与热力学系统中能量和熵之间相似的思路，同时使用非平衡热力学的概念量化这种过程中的效率低下和计算资源的关系。

Dec, 2013

在计算资源限制下推理信念和行动

讨论在计算能力不足时使用替代逼近过程和启发式方法以及使用用户效用结构对推理进行量身定制来平衡部分结果的成本和收益的应用决策理论来解决困难问题的解决方案。

Mar, 2013

一种面向分层决策系统专业化的信息论在线学习原理

研究信息 - 理论有限理性的决策者组合问题，并提出了一种基于在线学习规则的问题空间的分区方案，旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类，回归，强化学习和自适应控制等领域。

Jul, 2019

有限理性代理人的决策制定

通过将有限理性概念与信息论观点相结合，将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动，模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。

Oct, 2022

容量有限认知及强化学习的速率失真理论

本文介绍了一种信息理论模型，它使用一个有限传输速率的通信通道作为决策代理行为的描述，并在此基础上研究了一种基于学习目标的容量有限的决策制定方法，为实现高效的学习算法提供了贝叶斯遗憾界的保证。

Oct, 2022

有限感性合理性理论

本文提出一种不需要假定逻辑全知的有限理性归纳代理理论，要求有限理性归纳代理无限次地测试每个高效可计算的假设，然后遵循那些能够实现高奖励的假设。同时，探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。

Jul, 2023

有限认知负荷下的贝叶斯强化学习

生物和人工智能在决策过程中都受到信息处理能力的限制，因此一般的自适应行为理论应该考虑代理的学习历史、决策和能力约束之间的复杂交互。最近的计算机科学研究开始通过强化学习、贝叶斯决策制定和速率失真理论中的思想来澄清这些动态的形成规律。这项研究成果提出了基于能力限制的贝叶斯强化学习的规范框架，用于模拟处理约束对学习和行动选择的影响。本文对这一领域的最新算法和理论结果进行了简明审视，特别关注如何将这些思想应用于认知和行为科学中的问题。

May, 2023

人类认知效率反映了计划信息处理

通过两个实验，本文将计划的计划表述为元推理问题，并用一个递归贝尔曼目标来形式化计划。我们的研究成果在规划、状态抽象和认知控制方面提供了新的见解。

Feb, 2020