探索和导航的目标屏蔽扩散策略

Oct, 2023

NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration

PDF

Ajay Sridhar, Dhruv Shah, Catherine Glossop, Sergey Levine

TL;DR机器人学习在陌生环境中导航需要提供任务导向导航和任务无关探索的策略。本文介绍了如何训练一个统一的扩散策略来处理目标导向导航和目标无关探索，证明了该统一策略在导航到视觉指示目标时相比于其他方法具有更好的性能和更低的碰撞率。

Abstract

robotic learning for navigation in unfamiliar environments needs to provide policies for both task-oriented →

robotic learning navigation unfamiliar environments goal-directed navigation goal-agnostic exploration

发现论文，激发创造

基于价值引导扩散策略的部分可观测环境下的多用途导航

基于部分可观测性的 2D 和 3D 路径规划中，我们提出了一种多功能的基于扩散的方法，通过增加计划预测和状态估计，以及最佳计划选择策略和点云映射技术，优于传统自回归和基于扩散的方法，并实现从 2D 到 3D 的零 - shot 转移。

Apr, 2024

图像目标导航的变形金刚

利用生成式 Transformer 模型，通过联合建模图像目标、摄像头观察和机器人过去的动作来预测未来的动作，从而实现对于长时间跨度的图像目标导航任务的稳健的、无需与环境实时交互的目标导向导航策略。

May, 2024

学习导航探索策略

本研究提出了使用基于学习的方法，实现任务无关的探索性导航的想法，在对比传统的使用几何技术和通用学习技术的情况下，所采用的包括了空间记忆的策略可以更好地探索新的 3D 环境，并将其用于下游任务。

Mar, 2019

从单一遍历中学习可部署的千米级导航策略

通过单次覆盖遍历记录数据，提出了一种有效地在移动机器人上快速学习面向目标导航策略的方法，并且能够在实际机器人上成功地部署，同时能够处理测试时的环境外观差异。

Jul, 2018

GNM: 一种通用导航模型，以驱动任何机器人

本文研究了如何通过结构相似的多种机器人的数据来训练基于视觉的导航通用目标条件模型，并分析了有效数据共享的必要设计决策，证明了从异构数据集训练的普适策略优于任何单一数据集训练的策略。

Oct, 2022

PlayFusion: 通过语言标注游戏实践实现技能获得

通过学习无结构和未经整理的数据来生成语言和视觉方面的方法成为了主流。本论文研究了从带有事后语言标签的无结构游戏数据中学习目标导向技能策略的问题，并借助扩散模型的进展，从无结构游戏数据中提取机器人技能。

Dec, 2023

面向分布感知的自主驾驶安全目标预测和符合模型规划

本文提出了一种基于模块化架构的学车任务分解方法，在障碍感知、目标预测和规划方面均取得了优秀的方法，并在 CARLA 模拟器上实现了最新的优秀结果。

Dec, 2022

对抗多智能体游戏中的扩散 - 强化学习层次化运动规划

基于强化学习的运动规划在自主导航到机器人操控等方面已显示出超越传统方法的潜力。本文针对部分可观察多智能体对抗潜逃游戏（PEG）中规划机动任务展开研究。我们提出了一种分层架构，将高层扩散模型与低层强化学习算法结合，分别用于全局路径规划和回避行为推理。该方法通过利用扩散模型引导强化学习算法进行更高效的探索，并提高了可解释性和预测能力，相较于基准模型的表现提高了 51.2%。

Mar, 2024

基于 Transformer 的目标导向强化学习在自主导航中的应用

通过使用新型的 Goal-guided Transformer-enabled reinforcement learning 方法，将目标状态作为场景编码器的输入来引导场景表示与目标信息相耦合，从而有效实现自主导航。该方法具有比其他现有基线更高的数据效率、性能、鲁棒性和从仿真到真实世界的泛化能力。

Jan, 2023

将算法规划和深度学习相融合用于部分可观测导航

提出了一种机器人系统的新方法，其中一个较大系统的每个构件都表示为可微分的程序，即深度神经网络，应用到一个具有挑战性的部分可观测机器人导航任务中。在预测性模拟实验中，成功训练 Navigation Networks（NavNets）来解决这个具有挑战性的部分可观察的导航任务。

Jul, 2018