探索和导航的目标屏蔽扩散策略
基于部分可观测性的 2D 和 3D 路径规划中,我们提出了一种多功能的基于扩散的方法,通过增加计划预测和状态估计,以及最佳计划选择策略和点云映射技术,优于传统自回归和基于扩散的方法,并实现从 2D 到 3D 的零 - shot 转移。
Apr, 2024
利用生成式 Transformer 模型,通过联合建模图像目标、摄像头观察和机器人过去的动作来预测未来的动作,从而实现对于长时间跨度的图像目标导航任务的稳健的、无需与环境实时交互的目标导向导航策略。
May, 2024
本研究提出了使用基于学习的方法,实现任务无关的探索性导航的想法,在对比传统的使用几何技术和通用学习技术的情况下,所采用的包括了空间记忆的策略可以更好地探索新的 3D 环境,并将其用于下游任务。
Mar, 2019
通过单次覆盖遍历记录数据,提出了一种有效地在移动机器人上快速学习面向目标导航策略的方法,并且能够在实际机器人上成功地部署,同时能够处理测试时的环境外观差异。
Jul, 2018
本文研究了如何通过结构相似的多种机器人的数据来训练基于视觉的导航通用目标条件模型,并分析了有效数据共享的必要设计决策,证明了从异构数据集训练的普适策略优于任何单一数据集训练的策略。
Oct, 2022
通过学习无结构和未经整理的数据来生成语言和视觉方面的方法成为了主流。本论文研究了从带有事后语言标签的无结构游戏数据中学习目标导向技能策略的问题,并借助扩散模型的进展,从无结构游戏数据中提取机器人技能。
Dec, 2023
本文提出了一种基于模块化架构的学车任务分解方法,在障碍感知、目标预测和规划方面均取得了优秀的方法,并在 CARLA 模拟器上实现了最新的优秀结果。
Dec, 2022
基于强化学习的运动规划在自主导航到机器人操控等方面已显示出超越传统方法的潜力。本文针对部分可观察多智能体对抗潜逃游戏(PEG)中规划机动任务展开研究。我们提出了一种分层架构,将高层扩散模型与低层强化学习算法结合,分别用于全局路径规划和回避行为推理。该方法通过利用扩散模型引导强化学习算法进行更高效的探索,并提高了可解释性和预测能力,相较于基准模型的表现提高了 51.2%。
Mar, 2024
通过使用新型的 Goal-guided Transformer-enabled reinforcement learning 方法,将目标状态作为场景编码器的输入来引导场景表示与目标信息相耦合,从而有效实现自主导航。该方法具有比其他现有基线更高的数据效率、性能、鲁棒性和从仿真到真实世界的泛化能力。
Jan, 2023
提出了一种机器人系统的新方法,其中一个较大系统的每个构件都表示为可微分的程序,即深度神经网络,应用到一个具有挑战性的部分可观测机器人导航任务中。在预测性模拟实验中,成功训练 Navigation Networks(NavNets)来解决这个具有挑战性的部分可观察的导航任务。
Jul, 2018