野外视觉导航：利用预训练模型和在线自监督实现快速遍历能力学习

Apr, 2024

野外视觉导航：利用预训练模型和在线自监督实现快速遍历能力学习

Wild Visual Navigation: Fast Traversability Learning via Pre-Trained Models and Online Self-Supervision

Matías Mattamala, Jonas Frey, Piotr Libera, Nived Chebrolu, Georg Martius...

TL;DR本研究介绍了一种自适应自主学习系统，用于视觉可穿越性估计并通过机器人导航复杂的户外环境，实现了高效准确的自主导航。

Abstract

Natural environments such as forests and grasslands are challenging for robotic navigation because of the false perception of rigid obstacles from high grass, twigs, or bushes. In this work, we present Wild Visual Navigation (WVN), an online →

robotic navigation visual traversability estimation self-supervised learning online scheme for supervision traversable terrain segmentation

发现论文，激发创造

野外视觉导航中的快速遍历估计

本文提出了一种基于视觉的在线自监督学习系统 - Wild Visual Navigation（WVN），用于遍历可行性估计，并且可以在户外环境中适应地学习，可以在 5 分钟以内训练机器人，使其能够穿越复杂的户外地形，并克服高草障碍。

May, 2023

基于在线视觉语言映射的真实世界视觉语言导航

在本文中，我们提出了一个在真实世界中解决 VLN 任务的新型导航框架，该框架利用强大的基础模型，并包括四个关键组成部分：(1) 将语言指令转换为预定义的宏操作描述的 LLMs-based 指令解析器，(2) 构建实时的视觉 - 语言地图以保持对未知环境的空间和语义理解的在线视觉 - 语言映射器，(3) 基于语言索引的定位器，将每个宏操作描述重新映射到地图上的路径点位置，以及 (4) 基于 DD-PPO 的本地控制器，用于预测动作。我们在未知的实验室环境中使用 Interbotix LoCoBot WX250 对提出的流程进行了评估，而无需进行任何细微调整，在真实世界中，我们的流程明显优于 SOTA VLN 基线。

Oct, 2023

WayFAST: 地面行进预测导航

WayFAST（无路标自主系统）是一种基于自我监督学习方法，使用 RGB 和深度数据以及导航经验，在户外非结构化环境中自动生成适合行走的路径，通过对移动机器人轮胎牵引力的估计以及基于牵引力估计的在线过程中进行自我监督式的算法优化，能够学习避免几何障碍和不可横跨区域 (如雪地) 的有效方法，并且比其他启发式方法更有效。

Mar, 2022

ViNG: 使用视觉目标学习开放世界导航

提出了一个基于学习的导航系统，该系统应用于实际移动机器人平台，旨在使机器人通过学习来了解环境和导航便利性，以便在视觉引导下实现目标点的导航，经过实地测试和应用，该系统的表现优于其他以强化学习和搜索为基础的方法。

Dec, 2020

仅利用自我监督学习越野路面可行性

本文提出了一种基于自我监督的图像学习方法来训练自主车辆在各种条件下准确地遍历地形，通过生成自我监督的地形穿越标签和使用一元分类算法来识别能够安全穿越的地形，结合视觉表征的自我监督方法，在各种驾驶环境和感知条件下进行全面评估。

May, 2023

分析视觉和语言导航在未知的室外区域中的泛化能力

本研究探讨了在室外场景中，视觉代理如何跨越未知地形实现指令导航，发现与室内情况相比，图形化表达方式对室外导航具有更大的影响，因此未来的研究需关注在不同地形环境中的规模和多样性增长。

Mar, 2022

利用大型语言和视觉 - 语言模型在具有可穿越障碍物的环境中进行互动导航

提出一个互动导航框架，使用大型语言和视觉语言模型，使机器人能在存在可通过的障碍物的环境中导航。利用大型语言模型（GPT-3.5）和开放域视觉语言模型（Grounding DINO），创建一个动作感知的成本图，可以实现有效的路径规划而无需微调。实验结果证明了该框架在不同环境中的有效性和适应性。

Oct, 2023

VANP：自我监督视觉行动预训练导航中的视觉焦点学习

提出了一种自我监督视觉行为模型（VANP）用于视觉导航的预训练，通过最大化嵌入之间的信息来学习与导航任务相关的特定视觉区域，实现了与完全监督模型相媲美的性能，同时减少了一半的训练时间和仅使用 0.08% 的 ImageNet 数据进行训练。

Mar, 2024

面向视力障碍者的导航智能体：一种人行道模拟器和实验

为解决盲人室外导航问题，引入 SEVN 模拟环境和基于神经网络的导航代理方法，RL 算法（PPO）通过多模式观测（可变分辨率图像、可见文本和模拟 GPS 数据）导航到目标门。

Oct, 2019

视觉语言导航的模拟与实际转化

本文旨在研究如何将视觉 - 语言导航技术 (VLN) 从模拟场景应用于物理机器人，并提出了使用子目标模型和领域随机化等方法，以提升在未知环境下的表现。作者在 325 平方米的办公室内进行实验，结果表明，在提前采集和注释了占用图和导航图的情况下，模拟 - to - 真实的转移成功率可达 46.8%，而完全没有先前信息的情况下，转移成功率仅有 22.5%。

Nov, 2020