具有自修改能力的有界理性智能体性能

AAAINov, 2020

具有自修改能力的有界理性智能体性能

Performance of Bounded-Rational Agents With the Ability to Self-Modify

Jakub Tětek, Marek Sklenka, Tomáš Gavenčiak

TL;DR我们调查了受限理性的代理如何随着时间的推移受到自我修改的负面影响，分析了其大小与代理的理性失误的类型和严重程度之间的关系，其中特别指出在选择非最佳行为的情况下可能会出现指数级错误对齐的情况。

Abstract

self-modification of agents embedded in complex environments is hard to avoid, whether it happens via direct means (e.g. own code modification) or indirectly (e.g. influencing the operator, exploiting bugs or the environment). It has been argued that →

self-modification intelligent agents bounded rationality misalignment performance deterioration

发现论文，激发创造

有限理性代理人的决策制定

通过将有限理性概念与信息论观点相结合，将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动，模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。

Oct, 2022

自动化机器学习、有限理性和合理元推理

这篇论文从有限理性的角度出发，将 AutoML 工具视为一个快速训练给定数据集模型的代理，并探讨了如何在元层面上寻找适当的 ML 管道的问题。

Sep, 2021

可证明的有界最优智能体

本篇论文提出了有限最优性作为一种人工智能的理论基础，该理论基础通过解决机器架构和任务环境的约束优化问题来定义程序的最优性，以在实时环境下构建智能体，其中包括使用自动化邮件排序设施模型来说明结果。

May, 1995

信息论有界理性

本文提出了基于信息理论思想的有限理性理论，并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策，扩展后得到的类别决策问题非常广泛，包括古典决策规则等极限情况以及可信和风险敏感规划。

Dec, 2015

有限感性合理性理论

本文提出一种不需要假定逻辑全知的有限理性归纳代理理论，要求有限理性归纳代理无限次地测试每个高效可计算的假设，然后遵循那些能够实现高奖励的假设。同时，探讨了不同有限理性归纳代理之间的策略交互并证明了有限理性归纳代理可以趋于何种策略的民间定理。

Jul, 2023

代理人无需了解其目的

确保人工智能与人类价值观保持一致被称为对齐挑战，本文描述了一种名为遗忘智能体的代理程序，该程序的行为合理，构建了设计者意图的内部近似，从而最大化了对齐，反而随着代理程序智能水平的提高使对齐的机会得到了改进。

Feb, 2024

计算理性化：逆平衡问题

该文介绍了一种在多智能体领域应用的、基于逆优化控制、遗憾和最大熵原理的方法，用于预测与推广多智能体的行为，并恢复其奖励函数。

Mar, 2011

金融市场中的次理性人类投资者建模：偏见或局限

本文首先以强化学习为基础，设计一个模型来模拟多人市场模拟中的交易代理。然后，将人类的次理性分为两种类型：心理偏见和计算能力问题，探讨了人类次理性对交易市场不同方面的影响。作者认为本研究将有助于进一步了解人类交易行为和行为金融学领域的发展。

Oct, 2022

基于模型的效用函数

本文通过两个例子论证了将效用函数表达成环境模型的函数可以避免智能体的行为问题，并讨论了自修改智能体的问题。

Nov, 2011

面向多智能体系统的合一理性模型

本研究提出了一种通用模型，旨在设计具有社交智能的个体理性学习者的 AI，以实现其与其他类型的代理人的有效合作。该研究重点讨论了合理性、后悔和泛饱和效率对于实现社交智能的影响，并探讨了构建稳健的系统的重要性。

May, 2023