具有自修改能力的有界理性智能体性能
通过将有限理性概念与信息论观点相结合,将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动,模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。
Oct, 2022
本篇论文提出了有限最优性作为一种人工智能的理论基础,该理论基础通过解决机器架构和任务环境的约束优化问题来定义程序的最优性,以在实时环境下构建智能体,其中包括使用自动化邮件排序设施模型来说明结果。
May, 1995
本文提出了基于信息理论思想的有限理性理论,并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策,扩展后得到的类别决策问题非常广泛,包括古典决策规则等极限情况以及可信和风险敏感规划。
Dec, 2015
本文提出一种不需要假定逻辑全知的有限理性归纳代理理论,要求有限理性归纳代理无限次地测试每个高效可计算的假设,然后遵循那些能够实现高奖励的假设。同时,探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。
Jul, 2023
确保人工智能与人类价值观保持一致被称为对齐挑战,本文描述了一种名为遗忘智能体的代理程序,该程序的行为合理,构建了设计者意图的内部近似,从而最大化了对齐,反而随着代理程序智能水平的提高使对齐的机会得到了改进。
Feb, 2024
本文首先以强化学习为基础,设计一个模型来模拟多人市场模拟中的交易代理。然后,将人类的次理性分为两种类型:心理偏见和计算能力问题,探讨了人类次理性对交易市场不同方面的影响。作者认为本研究将有助于进一步了解人类交易行为和行为金融学领域的发展。
Oct, 2022
本研究提出了一种通用模型,旨在设计具有社交智能的个体理性学习者的 AI,以实现其与其他类型的代理人的有效合作。该研究重点讨论了合理性、后悔和泛饱和效率对于实现社交智能的影响,并探讨了构建稳健的系统的重要性。
May, 2023