- 通用上下文学习基准测试
通过增加上下文和记忆状态的规模,以提高在上下文中学习和推广能力,与普通的上下文学习相比,泛化性上下文学习(GPICL)在广泛的任务范围内扩展学习视野,并从较低的零样本基线开始。
- 人工通用智能的定义是什么?关于人工总体智能的定义
本文旨在建立对 AGI 定义的共识,智能通常是指根据特定原则在有限资源下适应开放环境的能力,并强调适应或学习是智能的不可或缺特性,并将争议的部分置于智能的原则中,从不同视角对其进行描述。
- PuzzleVQA: 通过抽象视觉模式诊断语言模型的多模态推理挑战
通过对抽象模式的基本概念进行评估,我们发现大型多模态模型在简单抽象模式上无法很好地泛化。通过对大型多模态模型的推理挑战进行系统分析,我们发现主要瓶颈在于较弱的视觉感知和归纳推理能力。
- ICLR强大的代理学习因果世界模型
任何能够满足大量分布变化下后悔边界的代理必须学习数据生成过程的近似因果模型,对于最优代理而言,该模型将趋近于真实的因果模型。这一结果对于包括迁移学习和因果推断在内的几个研究领域具有重要影响。
- KIX: 一种元认知泛化框架
人工智能系统的自主和通用行为是可能的,但需要理解和应用关键的结构化知识表示方法,通过交互对象实现类型空间以学习可转移的互动概念和泛化的元认知普适框架 (KIX) 可以与强化学习自然地整合知识,扮演推动人工智能系统实现自主和通用行为的关键角色 - 揭示语言模型中的普遍智能因子:一种心理测量学方法
该研究通过对两个庞大的数据集进行因子分析,揭示了语言模型中的综合智能因素,提供了一种用于模型评估的统一度量,为未来的人工智能研究和模型评估奠定了基础。
- 人类与大型语言模型中的归纳推理
本文采用 GPT-3 和 GPT-4 模型对归纳推理问题进行研究,实验证明 GPT-4 在大多数情况下能够与人类归纳推理行为相匹配,但无法涵盖前提非单调的现象。
- ChatGPT 能力概览及其对 AI 研究的影响
本文研究大型语言模型(LLMs)对人工智能研究的影响。通过以 GPT3.5 / ChatGPT3.4 和 ChatGPT 4 为例,我们展示这些模型具有什么样的功能,并且这些模型令人们瞩目的领域覆盖速度证明了这个趋势正在逐渐变成实现通用智能 - 通过世界模型掌握多样领域
DreamerV3 是一种基于世界模型的通用、可扩展的算法,具有较好的数据效率和最终性能,在各种单一或混合任务中表现优异,能够解决困扰强化学习发展的一系列挑战。
- 传递、多任务和元学习系统之间的同态映射
使用 Mesarovic 和 Takahara 的抽象系统理论,将转移学习、多任务学习和元学习形式化为抽象学习系统,并通过比较它们的输入输出系统、组合、层次结构和结构同构性,阐明了它们之间的形式化、一般系统差异。
- 核心和外围作为通向工程普适智能的封闭系统原则
本文介绍了工程智能化的方法,探究了其对环境的影响,给出了新的系统预设以及应对 AI 对于工程实践的挑战。