视觉导航中的视觉表征情境融合

Aug, 2019

Situational Fusion of Visual Representation for Visual Navigation

Bokui Shen, Danfei Xu, Yuke Zhu, Leonidas J. Guibas, Li Fei-Fei...

TL;DR通过多种视觉感知能力的训练和数据驱动的任务亲和力正则化，提出一种行动级的视觉表征融合方案，从而在新颖的环境中提高导航模型的性能。

Abstract

A complex visual navigation task puts an agent in different situations which call for a diverse range of visual perception abilities. For example, to "go to the nearest chair", the agent might need to identify a

visual perception navigation fusion scheme generalization affinity regularization

发现论文，激发创造

面向语义目标驱动导航的视觉表征

本研究主要探讨了如何在复杂环境下使用语义视觉导航技术，通过使用实时现成的高级语义和语境特征来训练深度神经网络的方式进行导航决策，并通过将现实和虚拟数据的特征表示结合起来提高模型的学习效果达到更高的导航性能。

May, 2018

具备场景先验知识的多智能体具身视觉语义导航

本文提出了一种基于多智能体协作的视觉语义导航方法，通过分层决策框架、场景先验知识和通信机制，可以使多个机器人协同完成探索任务，并在测试实验中表现出与单一智能体模型相比更高的准确性和效率。

Sep, 2021

具身视觉导航的深度学习：一项综述

综述了目前关于具有各种智能技能的智能机器人在 3D 环境中进行导航的研究领域，着重介绍了在这一领域内的各种高级技能，例如：感知局部观察视觉输入，理解跨模态的指令等等，并探讨了未来的研究方向及挑战。

Jul, 2021

利用丰富语义表示的面向对象的视觉导航目标

利用丰富的语义表示和基于目标的对象训练机器人进行视觉导航，证明该方法可以在短时间内使机器人对新的目标和未见过的场景进行泛化。

Nov, 2018

通过对空间配置进行推理实现导航

我们针对导航问题进行研究，提出了一种使用空间语义元素的神经代理导航模型，并探究了它们对导航代理的推理能力的影响。研究结果表明，指令中显式建模空间语义元素可以改善模型的基础和空间推理能力，并在已见及未见环境上取得了竞争性的性能。

May, 2021

使用语义地图监督学习导航视觉表征

我们提出了一种新颖的导航特定的视觉表示学习方法，通过对比代理的自我中心视图和语义地图（Ego$^2$-Map），将地图中的紧凑且丰富的信息转移到代理的自我中心表示中，从而实现室内导航。我们的实验结果表明，采用我们学习到的表示的代理在目标导航中优于最近的视觉预训练方法，并且我们的表示显著改善了连续环境下的视觉和语言导航，在高级和低级行动空间上均取得了 47％的 SR 和 41％的 SPL 的最新最佳结果。

Jul, 2023

跨模态融合与知识传递的鲁棒导航

通过跨模态融合方法和知识迁移框架，提出了一种改善移动机器人的泛化能力并实现从模拟到实际场景的导航技能转移的方法，通过教师 - 学生蒸馏架构，在理想环境中学习判别性表示和接近完美的策略，通过模仿教师的行为和表示，学生能够对来自多噪声模态输入的特征进行对齐，并减小变异对导航策略的影响，实验结果表明我们的方法在模拟和实际环境中全面超越了基准方法，并在不同工作条件下实现了稳健的导航性能。

Sep, 2023

将知识图谱与视觉感知对齐，进行物体目标导航

提出了一种将知识图谱与视觉感知对齐的方法，通过连续建模场景结构和利用视觉 - 语言预训练来实现更准确和一致的场景描述，从而提供了非凡的零样本导航能力。

Feb, 2024

观察，聆听和行动：走向音频视觉具身化导航

本文描述了一种音频 - 视觉导航方案，该方案基于移动智能机器人，利用可微卷积神经网络学习视觉感知器和声音感知器，以及动态路径规划器，实现在室内环境中通过音频和视觉数据计算从机器人当前位置到声源的最短路径。

Dec, 2019

空间注意力视觉导航

本研究对物体目标视觉导航进行了研究，旨在通过强化学习算法学习智能体的策略。我们提出了一种新的注意概率模型来改进代理策略，并在常用数据集上取得了最先进的结果。

Apr, 2021