机器人移动规划中的潜空间学习
本文综述了如何利用机器学习提高基于采样的运动规划器(SBMPs)的计算效率和适用性,包括提高节点采样、碰撞检测、局部规划等关键组件的学习方法,以及如何利用机器学习构建完整的 SBMP 结构,并提供了方法的优缺点以及未来的研究方向。
Nov, 2022
本文提出了一个基于图形结构的框架,包含可视化预测模块及提案网络模块,利用低维潜在空间进行常规复杂操作的动作计划,验证了在模拟环境和实际机器人中制定可行的任务完成方案及操作计划。
Mar, 2020
提出了一种基于条件变分自编码器的方法,通过学习演示数据中的采样分布,使用非均匀采样来加速规划过程并显著提高成功率和最优成本收敛速度,同时保持了采样策略理论保证的特性。
Sep, 2017
我们提出了一种 “生成 - 测试” 方法,用于在无已知动力学模型的自主移动代理中以有界风险进行规划,并使用变分自动编码器学习潜在线性动力学模型来生成候选轨迹。
Apr, 2024
通过引入分层行为和运动规划(HBMP),我们在学习驾驶解决方案中显式地建模行为,解决了不同场景的 RL 训练效率低下的问题,并在 SUMO 的快速事件仿真器中进行训练,最终在 CARLA 动力学仿真器中进行训练并转移到现实世界,证明了该方法的有效性和可推广性。
May, 2020
该研究使用无模型强化学习方法解决了部分已知环境下自主智能体的运动规划问题,提出了一种基于线性时态逻辑和 Markov 决策过程的方法,并应用于无人机的实际控制中。
Apr, 2023
提出了一个新颖的机器人终身学习问题模型,通过对任务和运动规划(TAMP)的学习利用模块化的方法设计生成混合模型,并根据辅助任务确定在线上使用共享或非共享模型,解决了数据如何在任务模型之间共享的问题。该方法在 2D 领域的模拟和 BEHAVIOR 基准测试中的实验中均实现了显著的规划成功率提升。
Jul, 2023
本文的研究重点是在具有不同形态的机器人操纵器之间传递控制策略。通过将源机器人和目标机器人的状态和动作空间投影到一个共同的潜在空间来实现跨机器人的策略转移。我们使用编码器、解码器和潜在空间控制策略同时进行训练,利用任务表现、潜在动力学一致性和编码器 - 解码器能力来重构原始状态和动作。为了转移学得的控制策略,我们只需要训练目标编码器和解码器来将新的目标领域对齐到潜在空间。我们使用生成对抗训练,通过循环一致性和潜在动力学损失,在目标领域中无需访问任务奖励或奖励调整,展示了模拟环境到真实环境以及不同状态、动作和形态的机器人之间的策略转移。
Jun, 2024
本论文提出了一种名为矢量量化运动规划转换器(VQ-MPT)的新方法,它克服了以往基于学习的方法的主要限制,包括无法扩展到更高维度空间和缺乏对分布之外环境的通用性,使其能够应用于各种复杂性系统,实现了较高的成功率和更快的路径规划。
Jun, 2023