虚拟环境的自动映射与视觉预测编码

Aug, 2023

虚拟环境的自动映射与视觉预测编码

Automated mapping of virtual environments with visual predictive coding

James Gornet, Matthew Thomson

TL;DR预测编码为构建认知地图的统一算法框架，并能通过视觉信息定位环境中的位置。

Abstract

Humans construct internal cognitive maps of their environment directly from sensory inputs without access to a system of explicit coordinates or distance measurements. While machine learning algorithms like SLAM utilize specialized visual inference procedures to identify visual feature

cognitive maps predictive coding neural network spatial maps visual information

发现论文，激发创造

主动预测编码：一种用于学习层次化世界模型以进行感知和规划的统一神经框架

提出了一种新的预测编码框架，称为主动预测编码，利用超网络、自监督学习和强化学习来学习层次化的世界模型，并成功解决了细分视觉和复杂动作序列组合等多个问题。

Oct, 2022

使用语义地图监督学习导航视觉表征

我们提出了一种新颖的导航特定的视觉表示学习方法，通过对比代理的自我中心视图和语义地图（Ego$^2$-Map），将地图中的紧凑且丰富的信息转移到代理的自我中心表示中，从而实现室内导航。我们的实验结果表明，采用我们学习到的表示的代理在目标导航中优于最近的视觉预训练方法，并且我们的表示显著改善了连续环境下的视觉和语言导航，在高级和低级行动空间上均取得了 47％的 SR 和 41％的 SPL 的最新最佳结果。

Jul, 2023

机器人导航的视觉语言地图

本研究提出了 VLMaps，一种将 3D 物理世界重建与预训练的视觉语言特征直接融合的空间地图表示，其能够通过大型语言模型将自然语言命令直接转化为空间导航目标。VLMaps 能够在不需要额外标注数据的情况下自主构建，并且可以与多种类型的机器人共享，能够进行导航的同时生成新的障碍物地图。实验表明，VLMaps 可以支持人类语言含义更丰富的导航指令。

Oct, 2022

基于预测编码和不确定性最小化的主动感知

运用预测编码和不确定性最小化两种生物启发式计算方式，提出了一种端到端的嵌入式探索过程，可用于解决任务无关的探索问题。在迷宫导航和积极视觉任务中，我们的模型均能够通过建立无监督表示，对感知场景进行主动采样、高效分类，学习效率更高、数据效率更高。此外，模型的模块化设计允许分析其内部机制以及在探索行为中，感知与行动之间的相互作用。

Jul, 2023

世界模型和预测编码在认知和发展机器人学中的应用：挑战与前沿

本文探讨了人工智能和机器人的世界模型和预测编码的关系及其在机器人认知发展中的作用，旨在为实现具有真正认知和发展能力的机器人打下基础。

Jan, 2023

隐空间中的基于模型的规划的时间预测编码

本文使用时间预测编码等方法，构建了一种信息论方法的强化学习模型，可帮助解决高维度观测值与复杂背景的问题。

Jun, 2021

基于神经网络的语义空间认知图形生成及抽象概念的出现

该研究使用神经网络学习 32 种动物的特征向量，并基于继承表示原理构建了一个 “动物空间” 的认知地图，该地图能够使用插值技术准确地表示完全新的或不完整的输入，并在不同的认知地图级别中呈现出不同的特征。

Oct, 2022

学习空间和时间的层次结构：多房间迷宫环境中的层次化主动推理导航

介绍了一种层次感知模型，结合认知地图、空间感知和位置运动，通过基于像素的观察推断出环境结构，并能在迷你格环境中进行高效探索和目标导向搜索。

Sep, 2023

视觉导航的认知映射与规划

提出一种学习从第一人称视角中建图并规划行动序列实现导航的神经网络架构，并应用于仿真和物理机器人环境中，取得了比其他基于学习或传统映射和路径规划方法更好的性能，能够扩展到语义化的目标。

Feb, 2017

自然语言的元预测学习模型

基于自注意力机制的大型语言模型在语言处理和自然语言本身中取得了惊人的成绩，并且在不同性质的各种任务中也取得了成绩。本文在预测编码框架内提出了一个平均场学习模型，成功地验证了其在分类手写数字和玩具以及真实语言语料库中的有效性。因此，我们的模型为研究语言处理和意想不到的普遍智能的物理和生物对应关系提供了一个起点。

Sep, 2023