体感人工智能综述:从模拟器到研究任务
我们提出了 “具身人工智能” 作为追求 “人工通用智能” 的下一个基本步骤,并对其与当前人工智能进展,特别是大型语言模型进行对比。我们横跨哲学、心理学、神经科学和机器人技术等多个领域探讨了具身概念的演变,以突显具身人工智能如何与静态学习的经典范式有所区别。通过拓宽具身人工智能的范围,我们提出了一个基于认知架构的理论框架,强调感知、行动、记忆和学习作为具身代理的重要组成部分。该框架与弗里斯顿的主动推理原则相一致,为具身人工智能的发展提供了一个全面的方法。尽管人工智能领域取得了进展,但仍存在诸多挑战,如制定新的人工智能学习理论和创新先进硬件等。我们的讨论为未来的具身人工智能研究提供了基础性的指导方针。强调创造具身人工智能代理能够与人类和其他智能体在真实环境中实现无缝通信、协作和共存的重要性,我们旨在引导人工智能社群应对多方面挑战,并抓住在追求人工通用智能过程中出现的机遇。
Feb, 2024
多模态人工智能系统中,基于 Agent 的多模态智能研究,通过在真实和虚拟环境中嵌入具有感知能力的智能体,能够处理和解释视觉和语境数据,以提高智能系统的上下文感知和交互能力。
Jan, 2024
该论文提出了一种名为虚拟体验(virtual embodiment)的多模式 AI 策略,它允许开发人工智能的可伸缩性,并以一种伦理负责的方式在领域内逐步推进。
Oct, 2016
人体化人工通用智能(AGI)的概念、其与人类意识的关系以及元宇宙在促进这种关系中的关键作用被检验。它凭借体验认知、Michael Levin 的计算边界、Donald D. Hoffman 的感知界面理论和 Bernardo Kastrup 的分析唯心主义等理论框架来建立实现人体化 AGI 的论点。研究人员认为,我们所感知到的外部现实是内在存在的替代性符号化表达,而 AGI 可以体现具有更大计算边界的更高意识。论文进一步讨论了 AGI 的发展阶段、实现人体化 AGI 的要求、为 AGI 提供校准符号界面的重要性,以及元宇宙、分散系统、开源区块链技术和开源 AI 研究所扮演的关键角色。它还探讨了在元宇宙空间中 AGI 和人类用户之间的反馈循环作为 AGI 校准工具,以及实现稳定人体化 AGI 的先决条件的地方调节和分散治理的角色。该论文最后强调了实现人类关系的某种和谐和认识到全球人类之间的相互联系的重要性,作为实现稳定人体化 AGI 的关键先决条件。
Feb, 2024
综述了目前关于具有各种智能技能的智能机器人在 3D 环境中进行导航的研究领域,着重介绍了在这一领域内的各种高级技能,例如:感知局部观察视觉输入,理解跨模态的指令等等,并探讨了未来的研究方向及挑战。
Jul, 2021
本文介绍了一项新的 AI 任务 -- 实体问答(EmbodiedQA),其中智能体在随机位置生成于 3D 环境中,通过主动感知、语言理解、目标导向的导航、常识推理和语言行动化等一系列 AI 技能完成问答任务,同时我们也开发了 EmbodiedQA 环境、端到端训练的强化学习智能体和评估协议。
Nov, 2017
本文提出了一种基于内省的代理机制,通过考虑代理自身的能力与环境背景相结合来实现任务目标,以增加现有体验智能机制的功能和实时适应性。
Jan, 2022
介绍了一个基于模拟环境的交互式和具身视觉 AI 研究平台 RoboTHOR,为解决模拟到真实世界的模型迁移问题提供了可能,为全球的研究者提供了一个远程测试具身模型的平台,并自举了实验结果表明,在模拟与物理世界中测试的模型训练性能存在显著差异,可能成为视觉计算的下一个发展阶段。
Apr, 2020
利用大型基础模型提高我们对开放环境中感知信息的理解,在 AI 研究中强调发展集成大型基础模型的代理人 AI,这一新兴领域涉及机器人技术、游戏和医疗等多种具身和基于代理的多模态交互,并讨论了代理人 AI 在各个领域和任务中展现出的能力,挑战我们对学习和认知的理解,通过跨学科视角探讨了代理人 AI 的潜力,并强调将其纳入科学讨论中,为未来的研究方向提供基础并促进更广泛的社会参与。
Feb, 2024