虚拟环境的自动映射与视觉预测编码
提出了一种新的预测编码框架,称为主动预测编码,利用超网络、自监督学习和强化学习来学习层次化的世界模型,并成功解决了细分视觉和复杂动作序列组合等多个问题。
Oct, 2022
我们提出了一种新颖的导航特定的视觉表示学习方法,通过对比代理的自我中心视图和语义地图(Ego$^2$-Map),将地图中的紧凑且丰富的信息转移到代理的自我中心表示中,从而实现室内导航。我们的实验结果表明,采用我们学习到的表示的代理在目标导航中优于最近的视觉预训练方法,并且我们的表示显著改善了连续环境下的视觉和语言导航,在高级和低级行动空间上均取得了 47%的 SR 和 41%的 SPL 的最新最佳结果。
Jul, 2023
本研究提出了 VLMaps,一种将 3D 物理世界重建与预训练的视觉语言特征直接融合的空间地图表示,其能够通过大型语言模型将自然语言命令直接转化为空间导航目标。VLMaps 能够在不需要额外标注数据的情况下自主构建,并且可以与多种类型的机器人共享,能够进行导航的同时生成新的障碍物地图。实验表明,VLMaps 可以支持人类语言含义更丰富的导航指令。
Oct, 2022
运用预测编码和不确定性最小化两种生物启发式计算方式,提出了一种端到端的嵌入式探索过程,可用于解决任务无关的探索问题。在迷宫导航和积极视觉任务中,我们的模型均能够通过建立无监督表示,对感知场景进行主动采样、高效分类,学习效率更高、数据效率更高。此外,模型的模块化设计允许分析其内部机制以及在探索行为中,感知与行动之间的相互作用。
Jul, 2023
本文探讨了人工智能和机器人的世界模型和预测编码的关系及其在机器人认知发展中的作用,旨在为实现具有真正认知和发展能力的机器人打下基础。
Jan, 2023
该研究使用神经网络学习 32 种动物的特征向量,并基于继承表示原理构建了一个 “动物空间” 的认知地图,该地图能够使用插值技术准确地表示完全新的或不完整的输入,并在不同的认知地图级别中呈现出不同的特征。
Oct, 2022
介绍了一种层次感知模型,结合认知地图、空间感知和位置运动,通过基于像素的观察推断出环境结构,并能在迷你格环境中进行高效探索和目标导向搜索。
Sep, 2023
提出一种学习从第一人称视角中建图并规划行动序列实现导航的神经网络架构,并应用于仿真和物理机器人环境中,取得了比其他基于学习或传统映射和路径规划方法更好的性能,能够扩展到语义化的目标。
Feb, 2017
基于自注意力机制的大型语言模型在语言处理和自然语言本身中取得了惊人的成绩,并且在不同性质的各种任务中也取得了成绩。本文在预测编码框架内提出了一个平均场学习模型,成功地验证了其在分类手写数字和玩具以及真实语言语料库中的有效性。因此,我们的模型为研究语言处理和意想不到的普遍智能的物理和生物对应关系提供了一个起点。
Sep, 2023