体感人工智能综述：从模拟器到研究任务

Mar, 2021

体感人工智能综述：从模拟器到研究任务

A Survey of Embodied AI: From Simulators to Research Tasks

Jiafei Duan, Samson Yu, Hui Li Tan, Hongyuan Zhu, Cheston Tan

TL;DR本文对体感式人工智能领域进行了综合系统的调查和研究，包括对九个当前体感式人工智能模拟器的评估，以及对于该领域的三项研究任务，即视觉探索、视觉导航和身体问题回答的探索，并旨在为该领域模拟器和未来方向的选择提供建议。

Abstract

There has been an emerging paradigm shift from the era of "internet AI" to "embodied ai", where AI algorithms and agents no longer learn from datasets of images, videos or text curated primarily from the internet. Instead, they learn through interactions with their environments from an

embodied ai simulators ai research visual exploration visual navigation

发现论文，激发创造

呼唤具象人工智能

我们提出了 “具身人工智能” 作为追求 “人工通用智能” 的下一个基本步骤，并对其与当前人工智能进展，特别是大型语言模型进行对比。我们横跨哲学、心理学、神经科学和机器人技术等多个领域探讨了具身概念的演变，以突显具身人工智能如何与静态学习的经典范式有所区别。通过拓宽具身人工智能的范围，我们提出了一个基于认知架构的理论框架，强调感知、行动、记忆和学习作为具身代理的重要组成部分。该框架与弗里斯顿的主动推理原则相一致，为具身人工智能的发展提供了一个全面的方法。尽管人工智能领域取得了进展，但仍存在诸多挑战，如制定新的人工智能学习理论和创新先进硬件等。我们的讨论为未来的具身人工智能研究提供了基础性的指导方针。强调创造具身人工智能代理能够与人类和其他智能体在真实环境中实现无缝通信、协作和共存的重要性，我们旨在引导人工智能社群应对多方面挑战，并抓住在追求人工通用智能过程中出现的机遇。

Feb, 2024

Agent AI：多模态交互视野调查

多模态人工智能系统中，基于 Agent 的多模态智能研究，通过在真实和虚拟环境中嵌入具有感知能力的智能体，能够处理和解释视觉和语境数据，以提高智能系统的上下文感知和交互能力。

Jan, 2024

Virtual Embodiment: 人工智能研究的可扩展长期战略

该论文提出了一种名为虚拟体验（virtual embodiment）的多模式 AI 策略，它允许开发人工智能的可伸缩性，并以一种伦理负责的方式在领域内逐步推进。

Oct, 2016

元宇宙在校准具有实体的通用人工智能中的作用

人体化人工通用智能（AGI）的概念、其与人类意识的关系以及元宇宙在促进这种关系中的关键作用被检验。它凭借体验认知、Michael Levin 的计算边界、Donald D. Hoffman 的感知界面理论和 Bernardo Kastrup 的分析唯心主义等理论框架来建立实现人体化 AGI 的论点。研究人员认为，我们所感知到的外部现实是内在存在的替代性符号化表达，而 AGI 可以体现具有更大计算边界的更高意识。论文进一步讨论了 AGI 的发展阶段、实现人体化 AGI 的要求、为 AGI 提供校准符号界面的重要性，以及元宇宙、分散系统、开源区块链技术和开源 AI 研究所扮演的关键角色。它还探讨了在元宇宙空间中 AGI 和人类用户之间的反馈循环作为 AGI 校准工具，以及实现稳定人体化 AGI 的先决条件的地方调节和分散治理的角色。该论文最后强调了实现人类关系的某种和谐和认识到全球人类之间的相互联系的重要性，作为实现稳定人体化 AGI 的关键先决条件。

Feb, 2024

具身视觉导航的深度学习：一项综述

综述了目前关于具有各种智能技能的智能机器人在 3D 环境中进行导航的研究领域，着重介绍了在这一领域内的各种高级技能，例如：感知局部观察视觉输入，理解跨模态的指令等等，并探讨了未来的研究方向及挑战。

Jul, 2021

具身化问答

本文介绍了一项新的 AI 任务 -- 实体问答（EmbodiedQA），其中智能体在随机位置生成于 3D 环境中，通过主动感知、语言理解、目标导向的导航、常识推理和语言行动化等一系列 AI 技能完成问答任务，同时我们也开发了 EmbodiedQA 环境、端到端训练的强化学习智能体和评估协议。

Nov, 2017

内省型智能体：代表行动机构的策略、生理和感知间的相互依存

本文提出了一种基于内省的代理机制，通过考虑代理自身的能力与环境背景相结合来实现任务目标，以增加现有体验智能机制的功能和实时适应性。

Jan, 2022

RoboTHOR：一个开放的从模拟到现实的具身化智能平台

介绍了一个基于模拟环境的交互式和具身视觉 AI 研究平台 RoboTHOR，为解决模拟到真实世界的模型迁移问题提供了可能，为全球的研究者提供了一个远程测试具身模型的平台，并自举了实验结果表明，在模拟与物理世界中测试的模型训练性能存在显著差异，可能成为视觉计算的下一个发展阶段。

Apr, 2020

位置论文：走向整体智能的智能代理

利用大型基础模型提高我们对开放环境中感知信息的理解，在 AI 研究中强调发展集成大型基础模型的代理人 AI，这一新兴领域涉及机器人技术、游戏和医疗等多种具身和基于代理的多模态交互，并讨论了代理人 AI 在各个领域和任务中展现出的能力，挑战我们对学习和认知的理解，通过跨学科视角探讨了代理人 AI 的潜力，并强调将其纳入科学讨论中，为未来的研究方向提供基础并促进更广泛的社会参与。

Feb, 2024

AllenAct: 一种行动式 AI 研究框架

介绍了一种模块化、灵活的学习框架 AllenAct，旨在提高交互式人工智能领域的可访问性和鼓励新研究人员的加入。

Aug, 2020