有限时间下的人类决策
本文提出了基于信息理论思想的有限理性理论,并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策,扩展后得到的类别决策问题非常广泛,包括古典决策规则等极限情况以及可信和风险敏感规划。
Dec, 2015
该论文提出了一个信息论的有界理性决策模型,其中决策者在预期效用和信息处理成本之间进行权衡,被视为物理状态发生变化时的热力学机器,行为受制于自由能泛函。当忽略计算成本时,该模型还原为最大化预期效用原则。
Apr, 2012
本文研究有限理性决策制定在考虑计算成本和期望效用之间进行权衡的过程,并探讨它与热力学系统中能量和熵之间相似的思路,同时使用非平衡热力学的概念量化这种过程中的效率低下和计算资源的关系。
Dec, 2013
讨论在计算能力不足时使用替代逼近过程和启发式方法以及使用用户效用结构对推理进行量身定制来平衡部分结果的成本和收益的应用决策理论来解决困难问题的解决方案。
Mar, 2013
研究信息 - 理论有限理性的决策者组合问题,并提出了一种基于在线学习规则的问题空间的分区方案,旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类,回归,强化学习和自适应控制等领域。
Jul, 2019
通过将有限理性概念与信息论观点相结合,将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动,模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。
Oct, 2022
本文介绍了一种信息理论模型,它使用一个有限传输速率的通信通道作为决策代理行为的描述,并在此基础上研究了一种基于学习目标的容量有限的决策制定方法, 为实现高效的学习算法提供了贝叶斯遗憾界的保证。
Oct, 2022
本文提出一种不需要假定逻辑全知的有限理性归纳代理理论,要求有限理性归纳代理无限次地测试每个高效可计算的假设,然后遵循那些能够实现高奖励的假设。同时,探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。
Jul, 2023
生物和人工智能在决策过程中都受到信息处理能力的限制,因此一般的自适应行为理论应该考虑代理的学习历史、决策和能力约束之间的复杂交互。最近的计算机科学研究开始通过强化学习、贝叶斯决策制定和速率失真理论中的思想来澄清这些动态的形成规律。这项研究成果提出了基于能力限制的贝叶斯强化学习的规范框架,用于模拟处理约束对学习和行动选择的影响。本文对这一领域的最新算法和理论结果进行了简明审视,特别关注如何将这些思想应用于认知和行为科学中的问题。
May, 2023