视觉动作学习和规划的少样本目标推断
本研究提出一种元模仿学习方法,通过深度神经网络对机器人进行高效学习,使机器人能够从一个单独的示例中获取新技能,并能够终端到端地学习。实验结果表明,该方法能够扩展到原始像素输入,并且需要较少前置任务数据,具有广泛的应用前景。
Sep, 2017
介绍了一种通过结合无监督表示学习和强化学习来获得一般技能库的算法,可以处理原始感官输入(如图像),并使用后期目标重新标记方案来进一步提高其方法的样本效率,在实际机器人系统上获得了比之前的技术更好的效果。
Jul, 2018
该论文提出了一种基于自监督学习的学习动力学模型,该模型可用于任务规划和策略学习,避免了视觉控制任务中由于真实环境的复杂度超过模型容量所导致的训练效率低的问题。
Jul, 2020
本文介绍了一种使用自监督学习方法和动力学模型和距离函数相结合的视觉目标到达方法,可用于训练通用机器人执行多种任务,该方法不需要手动设计奖励函数,仅使用无标签数据进行学习,并表现出较高的性能。
Dec, 2020
通过不对人类先验假设的依赖,我们可以通过非对称自我博弈的方法训练出只需稀疏奖励的 Bob,并且他可以从 Alice 的轨迹中学习,以实现目标发现和机器人操作的一体化控制。
Jan, 2021
本文提出了使用自回归进行离线机器人技能学习,并通过先前的数据学习环境的形式理解,该方法可以处理高维相机图像,可以学习到许多技能,并通过一系列技术进行训练,此方法具有较强的泛化能力,可以在多个目标之间进行目标链接,通过预训练或辅助目标学习到丰富的表示。
Apr, 2021
本研究解决了机器人在学习新技能时所面临的样本效率低下的问题。我们提出了一种新颖的组合方法DSE-扩散分数平衡,通过结合基础政策先验,实现了少样本学习,并利用概率组合扩散政策更好地建模示范数据分布。实验结果表明,该方法在技能学习中,MMD-FK指标平均减少超过30%,并且在现实世界实验中成功教授了机器人新轨迹。
Oct, 2024