通用智能度量的逼近方法
本文旨在通过数学公式将各种形式的人工智能定义转化为机器学习中的智能度量,并将之与通用最优学习智能体的理论联系起来,最后综述了已经为机器学习提出的智能度量和测试方法。
Dec, 2007
本文提供了 Universal Artificial Intelligence (UAI) 理论的非正式概述,讨论了智能的特征,一些社会问题和 UAI 的过去和未来,并介绍了代理人 AIXI 和其近似算法的发展和实验研究。
Feb, 2012
该研究介绍了智能系统自识别反馈信号的必要性,提出了基于算法信息理论的智能定义,阐明了人工智能基准测试的重要性,介绍了一个使用人类内在先验近似设计的基准测试集 ——ARC,用于度量具有高通用流体智能的人工智能系统与人类的综合智能的比较。
Nov, 2019
讨论了算法信息论中普适图灵机的选择对于 AIXI 的影响,研究结果表明,没有普遍不变定理。各种不幸或者对抗性的选择 UTM 的情况都会极大地干扰 AIXI 的行为,这意味着 AIXI 是一种相对论,完全取决于 UTM 的选择。
Oct, 2015
本文继续研究适用于归纳推理系统的体积和能量测量,扩展了 AIT 中的逻辑深度和概念跳跃大小测量到随机问题和涉及体积和能量的物理测量,介绍了计算复杂性的图形模型,展示出归纳推理的能量、逻辑深度和计算体积之间的一些渐近关系,引入了基于能量限制的算法熵,并简要讨论了我们宇宙中智能计算的物理极限。
Apr, 2015
本文介绍了一种名为 Unanimous Improvement Ratio(UIR)的度量方法,它不仅补充了标准指标组合方法的不足,还可以评估指标之间的交互作用,本文还通过实验验证了该方法的有效性,并将其作为精度和召回率之间权衡的一种预测器。
Jan, 2014
评估人工系统是否存在意识的问题日益成为关注焦点,而严格的心理测量框架对于评估大型语言模型在此方面的重要性至关重要。本文通过将人类和动物大脑的信息耦合、人类认知发展、新兴能力和心理表征发展与大型语言模型的类似现象进行比较,以心理测量智力的方式,间接估计意识体验的程度。相较于广泛的科学与形而上学意识理论,本文认为所有系统在心理测量上拥有一定程度的意识,智力的心理测量可能用于衡量异类系统(无论是人工还是人类)之间意识体验的相对相似性。
Aug, 2023