野外视觉导航:利用预训练模型和在线自监督实现快速遍历能力学习
本文提出了一种基于视觉的在线自监督学习系统 - Wild Visual Navigation(WVN),用于遍历可行性估计,并且可以在户外环境中适应地学习,可以在 5 分钟以内训练机器人,使其能够穿越复杂的户外地形,并克服高草障碍。
May, 2023
在本文中,我们提出了一个在真实世界中解决 VLN 任务的新型导航框架,该框架利用强大的基础模型,并包括四个关键组成部分:(1) 将语言指令转换为预定义的宏操作描述的 LLMs-based 指令解析器,(2) 构建实时的视觉 - 语言地图以保持对未知环境的空间和语义理解的在线视觉 - 语言映射器,(3) 基于语言索引的定位器,将每个宏操作描述重新映射到地图上的路径点位置,以及 (4) 基于 DD-PPO 的本地控制器,用于预测动作。我们在未知的实验室环境中使用 Interbotix LoCoBot WX250 对提出的流程进行了评估,而无需进行任何细微调整,在真实世界中,我们的流程明显优于 SOTA VLN 基线。
Oct, 2023
WayFAST(无路标自主系统)是一种基于自我监督学习方法,使用 RGB 和深度数据以及导航经验,在户外非结构化环境中自动生成适合行走的路径,通过对移动机器人轮胎牵引力的估计以及基于牵引力估计的在线过程中进行自我监督式的算法优化,能够学习避免几何障碍和不可横跨区域 (如雪地) 的有效方法,并且比其他启发式方法更有效。
Mar, 2022
提出了一个基于学习的导航系统,该系统应用于实际移动机器人平台,旨在使机器人通过学习来了解环境和导航便利性,以便在视觉引导下实现目标点的导航,经过实地测试和应用,该系统的表现优于其他以强化学习和搜索为基础的方法。
Dec, 2020
本文提出了一种基于自我监督的图像学习方法来训练自主车辆在各种条件下准确地遍历地形,通过生成自我监督的地形穿越标签和使用一元分类算法来识别能够安全穿越的地形,结合视觉表征的自我监督方法,在各种驾驶环境和感知条件下进行全面评估。
May, 2023
本研究探讨了在室外场景中,视觉代理如何跨越未知地形实现指令导航,发现与室内情况相比,图形化表达方式对室外导航具有更大的影响,因此未来的研究需关注在不同地形环境中的规模和多样性增长。
Mar, 2022
提出一个互动导航框架,使用大型语言和视觉语言模型,使机器人能在存在可通过的障碍物的环境中导航。利用大型语言模型(GPT-3.5)和开放域视觉语言模型(Grounding DINO),创建一个动作感知的成本图,可以实现有效的路径规划而无需微调。实验结果证明了该框架在不同环境中的有效性和适应性。
Oct, 2023
提出了一种自我监督视觉行为模型(VANP)用于视觉导航的预训练,通过最大化嵌入之间的信息来学习与导航任务相关的特定视觉区域,实现了与完全监督模型相媲美的性能,同时减少了一半的训练时间和仅使用 0.08% 的 ImageNet 数据进行训练。
Mar, 2024
为解决盲人室外导航问题,引入 SEVN 模拟环境和基于神经网络的导航代理方法,RL 算法(PPO)通过多模式观测(可变分辨率图像、可见文本和模拟 GPS 数据)导航到目标门。
Oct, 2019
本文旨在研究如何将视觉 - 语言导航技术 (VLN) 从模拟场景应用于物理机器人,并提出了使用子目标模型和领域随机化等方法,以提升在未知环境下的表现。作者在 325 平方米的办公室内进行实验,结果表明,在提前采集和注释了占用图和导航图的情况下,模拟 - to - 真实的转移成功率可达 46.8%,而完全没有先前信息的情况下,转移成功率仅有 22.5%。
Nov, 2020