基于模型的效用函数
本文介绍了一种针对多智能体 / 机器人系统的实用模型,旨在引导智能体选择合理的策略,达到其当前需求和学习合作,建立稳定可靠的关系,保证每个组成员的可持续发展,并且提出了几个有前途的研究方向。
Jun, 2023
本文探讨了当存在独立的多维目标且无法互相归约时,将目标形式化地表示为绝对数学函数所面临的困难性,并提出了使用不确定性目标作为一种替代方案。我们证明了,将已知的某些不可能定理转化为两种设置下的不确定定理,并证明了这些不可能结果所蕴含的不确定度的下限。最后,我们提出了两个关于不确定目标与人工智能系统的严重意外后果之间关系的猜想。
Dec, 2018
本研究提出了一种基于偏好学习方法的离线学习效用函数的优化算法,不仅可以使用关于结果的偏好,还可以使用效用函数空间的粗略信息,尤其在使用很少的结果时有助于提高效用函数的估计精度,并且可以结合模型来考虑效用函数学习任务中发生的不确定性。
Aug, 2022
确保人工智能与人类价值观保持一致被称为对齐挑战,本文描述了一种名为遗忘智能体的代理程序,该程序的行为合理,构建了设计者意图的内部近似,从而最大化了对齐,反而随着代理程序智能水平的提高使对齐的机会得到了改进。
Feb, 2024
本论文研究了将分类技术应用于效用调查中,通过识别与先前收集的效用函数数据库相关的群集来确定新用户的效用函数,从而减少全面求取用户效用的困难,并且在产前诊断领域的实验结果是相当有前途的。
Jan, 2013
我们调查了受限理性的代理如何随着时间的推移受到自我修改的负面影响,分析了其大小与代理的理性失误的类型和严重程度之间的关系,其中特别指出在选择非最佳行为的情况下可能会出现指数级错误对齐的情况。
Nov, 2020
通过对决策制定的愿望、偏好与效用函数的研究,我们将 von Neumann-Morgenstern 效用定理扩展至结构化的顺序决策制定情境中,发掘出对应效用函数的结构,并提出该结构应广泛应用于强化学习等顺序决策制定中的 AI 研究。
Jun, 2022
本文探讨了如何从单调偏好数据中学习效用函数,提供了用于多种重要类别的样本复杂度保证和有效算法,并使用最近多类学习的进展和有关线性价格模型的紧密联系,提出了一种解决线性效用函数学习问题的高效算法。(Sample complexity guarantees and efficient algorithms are provided for learning utility function from revealed preference data, and a computationally efficient algorithm with tight sample complexity guarantees is proposed for learning linear utility functions under a linear price model).
Jul, 2014