用于导航 ViZDoom “我的回家之路” 迷宫的紧急 Braitenberg 风格行为

Apr, 2024

用于导航 ViZDoom “我的回家之路” 迷宫的紧急 Braitenberg 风格行为

Emergent Braitenberg-style Behaviours for Navigating the ViZDoom `My Way Home' Labyrinth

Caleidgh Bayer, Robert J. Smith, Malcolm I. Heywood

TL;DR通过使用简单的 Braitentberg 风格启发式方法以及深度强化学习架构，我们展示出在复杂的可视部分观测状态下可以实现对由细胞图构成的迷宫进行导航，而仅使用了 0.8％的状态空间。

Abstract

The navigation of complex labyrinths with tens of rooms under visual partially observable state is typically addressed using recurrent deep reinforcement learning architectures. In this work, we show that

navigation labyrinths recurrent deep reinforcement learning braitentberg-style heuristic program graphs

发现论文，激发创造

基于数据增强的模型驱动增强学习用于解决实际迷宫游戏的高样本效率学习

通过基于模型的强化学习技术，本研究提出了一种用于导航和解决迷宫游戏的机器人系统的开发与训练。该方法通过从摄像头图像中提取低维观测以及裁剪和校正的以迷宫当前位置为中心的图像块，为迷宫布局提供了有价值的信息。控制策略的学习完全在物理系统上进行，使用基于模型的强化学习方法，其中沿着迷宫路径的进展作为奖励信号。此外，我们利用系统固有的对称性增加了训练数据。因此，我们的方法通过仅使用 5 小时的真实世界训练数据，在极短时间内成功解决了一种流行的真实世界迷宫游戏。

Dec, 2023

学习在复杂环境中导航

利用增强学习问题和多模态感应输入的辅助深度预测和循环闭环分类任务，可以学习从复杂 3D 迷宫中进行导航并接近人类级别表现

Nov, 2016

基于深度学习的室内自主导航行为方法

本文提出了一种适用于室内机器人导航的语义图形表示方法，该表示方法以语义位置和导航行为为节点和边，利用深度学习架构直接从视觉输入生成导航行为，无需计算机器人精确位置和环境几何关系，实现以更高的语义抽象水平导航的目的。

Mar, 2018

回家：通过想象路径找到回家的路

通过使用基于像素观察学习到的生成模型，将未访问过的路径纳入规划算法，可以帮助实现动物类的巡航行为，并且可以更准确地预测其新路径。

Aug, 2022

通过深度强化学习探究 Morris 水迷宫中的导航策略

本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序，并自动分类了导航策略，将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素，最后研究了人工代理神经网络中激活的内部表征的发展，这些表征类似于老鼠大脑中发现的 place cells 和 head-direction cells，并且它们的存在与人工代理采用的导航策略有相关性。

Jun, 2023

无地图城市导航学习

该论文提出一种基于深度强化学习的城市级别自主导航模型，采用 Google StreetView 进行环境交互和训练，具备可迁移性和区域特征一致性，实现了在多个城市环境下自主导航到目标位置。

Mar, 2018

从 YouTube 视频中学习视觉与语言导航

通过利用大规模的房屋导览视频数据集，本文提出了一种视觉语言导航方法，使用自动构建的路径指令对训练的代理进行预训练，并利用视频中的布局信息来提高导航的泛化性能。通过实验结果表明，该方法在两个流行的基准测试（R2R 和 REVERIE）上取得了最先进的性能。

Jul, 2023

加强型结构化状态演进的视觉语言导航

本文提出了一种新的结构化状态演化（SEvol）模型，采用基于图的特征来表示导航状态，利用增强学习策略通过 Reinforced Layout clues Miner（RLM）挖掘和检测关键的布局图，并通过结构演化模块（SEM）来维护结构化基于图的状态，从而提高了 Vision-and-language Navigation 任务的性能。

Apr, 2022

基于行为的图形定位网络的视觉导航

本文介绍一种基于图神经网络和卷积 / 循环神经网络实现的原始行为分解的、使用拓扑地图进行视觉导航的新方法，并在 Gibson 模拟器中验证了其在已知和未知环境中导航的性能优于相关基准线。

Mar, 2019

学习空间和时间的层次结构：多房间迷宫环境中的层次化主动推理导航

介绍了一种层次感知模型，结合认知地图、空间感知和位置运动，通过基于像素的观察推断出环境结构，并能在迷你格环境中进行高效探索和目标导向搜索。

Sep, 2023