基于模型的效用函数

Nov, 2011

Model-based Utility Functions

Bill Hibbard

TL;DR本文通过两个例子论证了将效用函数表达成环境模型的函数可以避免智能体的行为问题，并讨论了自修改智能体的问题。

Abstract

Orseau and Ring, as well as Dewey, have recently described problems, including self-delusion, with the behavior of agents using various definitions of utility functions. An agent's utility function is defined in terms of the agent's history of interactions with its environment. This pa

utility function environment model self-modifying agents prior assumptions human-designed agents

发现论文，激发创造

人机交互的实用函数

本文研究人机交互环境下的认知机器人建模问题，提出了一种基于效用的模型来管理机器人的行为，通过效用聚合函数将机器人对事态的责任嵌入到效用模型中。

Apr, 2022

机器人和人工智能中应用效用理论的理解：综述

本文介绍了一种针对多智能体 / 机器人系统的实用模型，旨在引导智能体选择合理的策略，达到其当前需求和学习合作，建立稳定可靠的关系，保证每个组成员的可持续发展，并且提出了几个有前途的研究方向。

Jun, 2023

人工智能价值对齐的不可能性和不确定性定理（或者为什么您的通用人工智能不应该具有效用函数）

本文探讨了当存在独立的多维目标且无法互相归约时，将目标形式化地表示为绝对数学函数所面临的困难性，并提出了使用不确定性目标作为一种替代方案。我们证明了，将已知的某些不可能定理转化为两种设置下的不确定定理，并证明了这些不可能结果所蕴含的不确定度的下限。最后，我们提出了两个关于不确定目标与人工智能系统的严重意外后果之间关系的猜想。

Dec, 2018

可达效用保存的保守智能机构

研究发现奖励功能易出现错误，为此介绍一种平衡主要奖励函数和辅助奖励函数优化的方法，即使辅助奖励函数是随机生成的，该方法也能诱导保守且有效的行为。

Feb, 2019

使用先验知识进行多目标参数优化的高效效用函数学习

本研究提出了一种基于偏好学习方法的离线学习效用函数的优化算法，不仅可以使用关于结果的偏好，还可以使用效用函数空间的粗略信息，尤其在使用很少的结果时有助于提高效用函数的估计精度，并且可以结合模型来考虑效用函数学习任务中发生的不确定性。

Aug, 2022

代理人无需了解其目的

确保人工智能与人类价值观保持一致被称为对齐挑战，本文描述了一种名为遗忘智能体的代理程序，该程序的行为合理，构建了设计者意图的内部近似，从而最大化了对齐，反而随着代理程序智能水平的提高使对齐的机会得到了改进。

Feb, 2024

效用协商作为分类问题

本论文研究了将分类技术应用于效用调查中，通过识别与先前收集的效用函数数据库相关的群集来确定新用户的效用函数，从而减少全面求取用户效用的困难，并且在产前诊断领域的实验结果是相当有前途的。

Jan, 2013

具有自修改能力的有界理性智能体性能

我们调查了受限理性的代理如何随着时间的推移受到自我修改的负面影响，分析了其大小与代理的理性失误的类型和严重程度之间的关系，其中特别指出在选择非最佳行为的情况下可能会出现指数级错误对齐的情况。

Nov, 2020

顺序决策的效用理论

通过对决策制定的愿望、偏好与效用函数的研究，我们将 von Neumann-Morgenstern 效用定理扩展至结构化的顺序决策制定情境中，发掘出对应效用函数的结构，并提出该结构应广泛应用于强化学习等顺序决策制定中的 AI 研究。

Jun, 2022

从显性偏好中学习经济参数

本文探讨了如何从单调偏好数据中学习效用函数，提供了用于多种重要类别的样本复杂度保证和有效算法，并使用最近多类学习的进展和有关线性价格模型的紧密联系，提出了一种解决线性效用函数学习问题的高效算法。(Sample complexity guarantees and efficient algorithms are provided for learning utility function from revealed preference data, and a computationally efficient algorithm with tight sample complexity guarantees is proposed for learning linear utility functions under a linear price model).

Jul, 2014