利用跳跃模型进行机器人领域的规划和快速学习

Feb, 2023

利用跳跃模型进行机器人领域的规划和快速学习

Leveraging Jumpy Models for Planning and Fast Learning in Robotic Domains

Jingwei Zhang, Jost Tobias Springenberg, Arunkumar Byravan, Leonard Hasenclever, Abbas Abdolmaleki...

TL;DR本文研究了从未标记的经验中学习多步动态预测模型（跳跃模型）及其在后续任务中快速推理（高级）计划的实用性。通过离线学习技能嵌入空间，我们提出了一种学习跳跃模型的方法，不需要标签或奖励注释。通过在 RGB 堆栈环境中进行一系列实验，展示了通过学习技能和相关模型进行规划可以实现对新任务的零 - shot 泛化，并且可以通过强化学习进一步加速策略的训练。这些实验表明，结合时间抽象的 jumpy 模型可以促进长视角任务中的规划，这些任务在标准动态模型中难以实现。

Abstract

In this paper we study the problem of learning multi-step dynamics prediction models (jumpy models) from unlabeled experience and their utility for fast inference of (high-level) plans in downstream tasks. In par

jumpy models multi-step dynamics prediction skill embedding space model-based planning model-free reinforcement learning

发现论文，激发创造

使用逆动力学模型从像素规划

提出了一种新的方法来学习依赖任务完成的未来动作序列预测的潜在世界模型，该模型适应地关注任务相关的动态学习，并同时充当稀疏奖励下计划的有效启发式方法，通过挑战性的视觉目标完成任务的评估，我们发现该方法较之前的无模型方法在性能上有了显著提高。

Dec, 2020

学习动态模型以用于模型预测代理

通过比较使用学习动力学模型进行规划和使用基准模拟器进行规划的性能，来澄清不同设计选择对学习动力学模型的作用，首先从 DeepMind 控制套件的 5 个域的训练序列收集了丰富的数据集，然后以监督方式训练前馈动态模型，并在不同的模型设计选择包括合成，随机性，多步培训和时间步选项时评估规划器性能。

Sep, 2021

目标感知预测：学习如何模拟重要因素

该论文提出了一种基于自监督学习的学习动力学模型，该模型可用于任务规划和策略学习，避免了视觉控制任务中由于真实环境的复杂度超过模型容量所导致的训练效率低的问题。

Jul, 2020

在线动态适应和神经网络先验的一次性操作技能学习

本研究提出了一种基于模型的强化学习算法，将以前任务的先验知识与在线动态模型适应相结合，实现了高效学习，并且成功地应用于各种复杂机器人操纵任务。

Sep, 2015

从像素学习潜在动力学规划

通过图像学习环境动态、通过快速在线规划选择动作，利用深度计划网络（PlaNet）解决了连续控制任务中的挑战，同时使用的强度模型相对较少。

Nov, 2018

在线强化学习中的规划的新视角

本文提出了一种新的基于模型的强化学习方法，使用背景规划来混合（近似）动态规划和无模型更新，以解决学习模型的不准确性和生成无效状态的问题，并通过约束背景规划到一组（抽象的）子目标和只学习局部的、以子目标为条件的模型来提高计算效率，自然地包含时间抽象以实现更快的长期规划，并完全避免学习转换动力学，展示了该方法在不同领域中可以帮助各种基础学习者更快地学习。

Jun, 2024

使用学习动作残差的连续多功能跳跃

提出了一种基于优化控制和强化学习相结合的分层框架，实现了四足机器人连续跳跃运动的控制，通过在模拟环境中的训练，该方法可以直接应用到真实机器人中，实现多方向、连续性跳跃。

Apr, 2023

基于技能的模型驱动增强学习

本研究提出了一种基于技能空间的模型强化学习（SkiMo）框架，使用技能动力学模型来规划，以实现精确和有效的长期规划，从而使学习复杂任务变得更加高效。该框架在导航和操作领域的实验结果表明，对于模型强化学习和技能强化学习，能够扩大时间范围并提高示范效率。

Jul, 2022

具有动态感知的无监督技能发现

通过结合基于模型的和基于非模型的机器学习方法，本文提出了一种无监督学习算法 DADS，用于发现易于预测的行为和学习它们的动态，提高了规划算法的效率和性能。

Jul, 2019

通过多任务强化学习实现稳健和多功能的双足跳跃控制

本文介绍了一种多任务强化学习框架，以训练扭矩控制双足机器人在现实世界中执行各种跳跃任务，通过不同的训练阶段和多样化的情境探索，最终实现了高鲁棒性的多任务策略，并为 Cassie 双足机器人在现实世界中完成各种具有挑战性的跳跃任务提供了支持。

Feb, 2023