- AI 原生记忆:从 LLMs 通往 AGI 的路径
通过集成记忆,我们设想了从大型语言模型(LLMs)到人工通用智能(AGI)的一种路径。我们认为 AGI 应该是一个 LLM 作为核心处理器的系统,其中除了原始数据外,该系统的记忆还可以存储推理过程中得出的大量重要结论。相比仅处理原始数据的检 - 符号学习推动自进化智能体
通过使用代理符号学习的系统性框架,本文介绍了一种使语言代理能够在数据中心的方式下自我优化的方法,为实现人工通用智能提供了关键的可能性。
- 跨模态安全对齐
人工通用智能(AGI)越来越多地融入到人类生活的各个方面,确保这些系统的安全和道德一致性至关重要。过去的研究主要关注单模态威胁,这可能不足以应对交叉模态相互作用的综合和复杂性。我们提出了一个名为 “安全输入但不安全输出(SIUO)” 的新型 - 使用机器学习和专家系统技术构建的自适应多领域人工智能系统的开发
通过结合经典人工智能技术 —— 专家系统与现代适应性梯度下降训练的专家系统(GDTES),利用生成式人工智能(GAI)创建网络和训练数据集的机制,本研究提出了一种人工智能的学习和发展推理路径以在先验未知领域做决策的方法,并展示了朝着产生人工 - ChartMimic: 通过图表生成代码评估 LMM 的跨模态推理能力
我们介绍了一个新的基准测试,ChartMimic,旨在评估大型多模态模型(LMMs)的视觉基础代码生成能力。ChartMimic 利用信息密集型的可视化图表和文本说明作为输入,要求 LMMs 生成相应的代码以进行图表渲染。ChartMimi - 从表现到认知体系结构:一个可扩展的框架
通过将现实解读为信息源,并将其转化为计算框架,我们提出了一种新颖的建模方法,从而接近于人工通用智能。该框架可以以流动可扩展的分层方式构建经典的认知架构元素,如长期记忆和工作记忆。
- ProG:图灵提示学习基准
人工智能在图上的通用智能在各种应用中取得了显著的进展,然而传统的 “预训练和微调” 范式在复杂和小样本场景下存在低效和负迁移问题。图提示学习作为一种有希望的替代方案出现,利用轻量级提示来操作数据,通过重新构思下游任务来填补任务间隙。然而,仍 - 机器心理学:将操作条件反射与非公理推理系统结合,推进人工智能普适性研究
这篇论文介绍了一种称为机器心理学的跨学科框架,将操作学习心理学原理与特定的人工智能模型非公理推理系统(NARS)相结合,以增强通用人工智能(AGI)研究。该框架的核心前提是适应对于生物和人工智能同样重要,可以通过操作条件性原理来理解。该研究 - 从索拉所见:文本到视频生成的调查
通过对 Sora 进行文本到视频生成的拆解以及文献综述,我们从不同角度对其进行了全面回顾,总结了人工智能和人工一般智能的发展现状,介绍了常用的数据集和评估指标,并提出了该领域的挑战和未来研究方向。
- 我们离 AGI 还有多远
人工智能的发展深刻影响了人类社会,并在多个领域取得了重大进展。然而,对人工智能的不断需求突显了其现有能力的局限性,推动了向人工通用智能(AGI)的发展。AGI 以其与人类智能相当的效率和有效性,具备执行多样化现实任务的能力,代表着人工智能演 - 物联网车联网中混合专家模型与多模态生成 AI 的集成:综述
通过集成 Moe 和 GAI 实现 IoV 中的人工通用智能,以实现 IoV 的全面自主性,减少人类监督,并适用于广泛的机动性场景,包括环境监测、交通管理和自动驾驶。
- AdvLoRA: 视觉 - 语言模型的对抗低秩适应
通过大量实验,我们展示了传统的视觉 - 语言模型(VLMs)所采用的常规适应方法的脆弱性,这可能带来重大的安全风险。此外,随着 VLMs 规模的增加,对 VLMs 进行传统的对抗性适应技术会带来高计算成本。为了解决这些问题,我们提出了一种名 - 面向先进机器学习算法的具有丰富交互能力的稳健软机器人
通过从自然中选择性启示,我们构建了具有大规模行动空间、多个相机提供的丰富传感数据流以及与其他系统连接以增强行动空间和数据流的强大且部分软性的机器人肢体。作为概念验证,我们训练了两种当代机器学习算法来执行简单的目标寻找任务,将这一设计视为构建 - 狂放的伊卡洛斯:多模态大语言模型安全中图像输入的潜在危险调研
多模态大型语言模型(MLLMs)的整合增强了其功能,但也带来了安全漏洞,本研究旨在分析并总结 MLLMs 的攻击和防御机制,并提出未来研究的建议,以深化对 MLLM 安全挑战的学术理解和发展可信赖的 MLLM 系统。
- InternLM2 技术报告
InternLM2 是一种开源的大型语言模型,通过创新的预训练和优化技术,在多个维度和 30 个基准测试中优于之前的模型,并在长文本建模和开放主观评估方面取得突出表现。该模型通过精心设计的预训练过程,使用了包括文本、代码和长文本数据在内的多 - ASI 作为新的神:技术技术统治
人工智能领域的研究越发接近通用人工智能(AGI),超级人工智能(ASI)同样也在逼近。本文认为由于 ASI 具有无与伦比的能力,人们可能会将其视为无比完美,从而产生对其决策的盲目接受的认知偏误。通过将 ASI 与全能、全知和无所不在等神性属 - RelationVLM: 构建大型视觉 - 语言模型以理解视觉关系
RelationVLM 是一种大型视觉语言模型,通过多阶段关系感知训练方案和相应的数据配置策略,使其具备理解多个图像或视频内的多个层次和类型关系的能力,该工作促进了 LVLM 的发展,使其能够支持更广泛的人工通用智能应用。
- Agent3D-Zero:一种用于零样本三维理解的智能体
通过引入 Agent3D-Zero 框架,我们能够以零样本学习的方式处理三维场景理解问题,通过选择和分析一系列视点来促进三维理解,并利用自定义的视觉提示来增强模型的能力。大量实验证明了该框架在理解各种以前未见的三维环境方面的有效性。
- 向通用人工智能的过渡场景
我们分析了在可能达到人工智能系统能执行人类所有任务的技术进步背景下,产出和工资的表现,并且假设人类的工作可以分解为不同复杂度的原子任务。技术进步使得越来越复杂的任务能够自动化。工资的影响取决于自动化与资本积累之间的竞赛。如果任务复杂度的分布 - 仿真:基于人类模仿的协作决策
提出和评估一种新颖的方法,在不依赖任何存储数据或预训练的情况下,在 LLM 代理之间进行知识蒸馏,以实时保留人类角色扮演中的独特语境,并评估我们的系统在模拟的真实世界任务中表现更好。