在真实环境中使用混合策略进行多目标导航
本文旨在研究如何将视觉 - 语言导航技术 (VLN) 从模拟场景应用于物理机器人,并提出了使用子目标模型和领域随机化等方法,以提升在未知环境下的表现。作者在 325 平方米的办公室内进行实验,结果表明,在提前采集和注释了占用图和导航图的情况下,模拟 - to - 真实的转移成功率可达 46.8%,而完全没有先前信息的情况下,转移成功率仅有 22.5%。
Nov, 2020
本文研究了多目标导航任务,通过四个模块(物体检测、语义地图构建、环境探索和导航)来解决此任务。结果表明,在 MultiON 任务中,采用 PointGoal 导航模型优于从头开始学习导航。与分析路径规划相比,基于 Agent 的导航模块表现更好。同时也探讨了探索策略并发现随机探索策略显著优于更高级的探索方法。我们还创建了 MultiON 2.0 数据集作为我们方法的测试平台。
Apr, 2023
本文介绍了一种基于对抗特征调整模型的 3D 室内导航机器人训练方法,通过视觉特征的转换与行为策略的模仿来提高机器人在真实环境中的表现。实验证明该方法能够在不需要额外人工注释的情况下,比基线方法表现提高 19.47%。
Apr, 2019
通过跨模态融合方法和知识迁移框架,提出了一种改善移动机器人的泛化能力并实现从模拟到实际场景的导航技能转移的方法,通过教师 - 学生蒸馏架构,在理想环境中学习判别性表示和接近完美的策略,通过模仿教师的行为和表示,学生能够对来自多噪声模态输入的特征进行对齐,并减小变异对导航策略的影响,实验结果表明我们的方法在模拟和实际环境中全面超越了基准方法,并在不同工作条件下实现了稳健的导航性能。
Sep, 2023
本文探讨了在三维环境中进行导航任务的挑战以及地图类记忆对导航任务的影响,提出了新的 MultiON 任务,通过一系列实验考察了不同复杂度任务下代理模型的表现,发现简单语义地图代理的表现相对更优,但神经图像特征地图代理和 oracle 地图代理也存在局限性,可能需要进一步的训练和研究。
Dec, 2020
我们在这篇论文中提出了一种隐式空间地图的目标导航方法,使用 transformer 递归更新隐式地图,并通过辅助任务训练模型,以重构显式地图、预测视觉特征、语义标签和动作。我们的方法在挑战性的 MP3D 数据集上显著优于最先进方法,并且在 HM3D 数据集上具有良好的泛化能力。我们成功地在真实机器人上部署了模型,并在真实场景中只使用了几个真实世界的演示来实现令人鼓舞的目标导航结果。
Aug, 2023
本研究提出了一种基于自监督学习的方法,通过对漫游的被动视频学习导航,而无需交互、地图信息或强化学习,旨在解决基于图像目标的导航任务,该方法可以作为使用强化学习或模拟的任何未来基于图像的导航任务的强大基准。
Oct, 2021
利用深度强化学习模型,基于无序的 actor-critic 框架和适当的奖励规范,提出了一个适用于多目标导航的机器人的算法,通过实验验证了这个方法在实践应用中胜过了预设顺序的方法和当下最先进的单个目标导航的方法。
May, 2023
在自主导航的地面机器人领域,现有的研究大多使用真实感的动力学和感知模型,而本篇论文致力于通过在仿真环境中进行端到端的训练,减小模型在现实机器人平台上的差距,并取得了显著的性能和稳健性的提升。
Jan, 2024
在本文中,我们提出了一个在真实世界中解决 VLN 任务的新型导航框架,该框架利用强大的基础模型,并包括四个关键组成部分:(1) 将语言指令转换为预定义的宏操作描述的 LLMs-based 指令解析器,(2) 构建实时的视觉 - 语言地图以保持对未知环境的空间和语义理解的在线视觉 - 语言映射器,(3) 基于语言索引的定位器,将每个宏操作描述重新映射到地图上的路径点位置,以及 (4) 基于 DD-PPO 的本地控制器,用于预测动作。我们在未知的实验室环境中使用 Interbotix LoCoBot WX250 对提出的流程进行了评估,而无需进行任何细微调整,在真实世界中,我们的流程明显优于 SOTA VLN 基线。
Oct, 2023