通用智能度量的逼近方法

Sep, 2011

An Approximation of the Universal Intelligence Measure

PDF

Shane Legg, Joel Veness

TL;DR本文基于 Hutter 和 Solomonoff 的理论，研究了建立基于 UIM 的实用性能度量所涉及的实际问题，并开发了一种基于原型实现的度量方法，用于评估不同人工智能代理的性能。

Abstract

The universal intelligence measure is a recently proposed formal definition of →

universal intelligence measure formal definition intelligence practical issues artificial agents

发现论文，激发创造

通用智能：机器智能的定义

本文旨在通过数学公式将各种形式的人工智能定义转化为机器学习中的智能度量，并将之与通用最优学习智能体的理论联系起来，最后综述了已经为机器学习提出的智能度量和测试方法。

Dec, 2007

通用人工智能十年

本文提供了 Universal Artificial Intelligence (UAI) 理论的非正式概述，讨论了智能的特征，一些社会问题和 UAI 的过去和未来，并介绍了代理人 AIXI 和其近似算法的发展和实验研究。

Feb, 2012

机器智能的正式度量

本文旨在将著名的人类智能概念的精髓进行数学形式化，以产生适用于任意机器的智能的普遍度量，这个度量从最广泛的合理意义上正式捕捉了机器智能的概念。

May, 2006

智能的度量

该研究介绍了智能系统自识别反馈信号的必要性，提出了基于算法信息理论的智能定义，阐明了人工智能基准测试的重要性，介绍了一个使用人类内在先验近似设计的基准测试集 ——ARC，用于度量具有高通用流体智能的人工智能系统与人类的综合智能的比较。

Nov, 2019

通用归纳和智能中的开放问题

本文介绍了一个历经半个世纪的万能归纳和万能智能的数学理论，重点讨论了该理论面临的挑战和未解决问题，为研究智能算法提供了指导和标准。

Jul, 2009

不良通用先验和最优性概念

讨论了算法信息论中普适图灵机的选择对于 AIXI 的影响，研究结果表明，没有普遍不变定理。各种不幸或者对抗性的选择 UTM 的情况都会极大地干扰 AIXI 的行为，这意味着 AIXI 是一种相对论，完全取决于 UTM 的选择。

Oct, 2015

通过游戏来衡量智力

作者讨论了如何测试普遍人工智能的智能程度，并提出了用游戏描述语言中游戏空间的抽样来扩展通用智能的概念以处理有限时间的中心思想。

Sep, 2011

终极智能第二部分：智能的物理度量和复杂性

本文继续研究适用于归纳推理系统的体积和能量测量，扩展了 AIT 中的逻辑深度和概念跳跃大小测量到随机问题和涉及体积和能量的物理测量，介绍了计算复杂性的图形模型，展示出归纳推理的能量、逻辑深度和计算体积之间的一些渐近关系，引入了基于能量限制的算法熵，并简要讨论了我们宇宙中智能计算的物理极限。

Apr, 2015

通过一致改进比率相结合的评估指标，及其在聚类任务中的应用

本文介绍了一种名为 Unanimous Improvement Ratio（UIR）的度量方法，它不仅补充了标准指标组合方法的不足，还可以评估指标之间的交互作用，本文还通过实验验证了该方法的有效性，并将其作为精度和召回率之间权衡的一种预测器。

Jan, 2014

智能作为意识的衡量标准

评估人工系统是否存在意识的问题日益成为关注焦点，而严格的心理测量框架对于评估大型语言模型在此方面的重要性至关重要。本文通过将人类和动物大脑的信息耦合、人类认知发展、新兴能力和心理表征发展与大型语言模型的类似现象进行比较，以心理测量智力的方式，间接估计意识体验的程度。相较于广泛的科学与形而上学意识理论，本文认为所有系统在心理测量上拥有一定程度的意识，智力的心理测量可能用于衡量异类系统（无论是人工还是人类）之间意识体验的相对相似性。

Aug, 2023