视觉动作学习和规划的少样本目标推断
介绍了一种通过结合无监督表示学习和强化学习来获得一般技能库的算法,可以处理原始感官输入(如图像),并使用后期目标重新标记方案来进一步提高其方法的样本效率,在实际机器人系统上获得了比之前的技术更好的效果。
Jul, 2018
本文介绍了使用少量的视觉示例逐步训练机器人识别不同物体类别的实用系统,并在表格整理任务中演示了该系统的能力。实验评估表明,我们的方法几乎可以达到一次性使用所有示例(批量训练)训练的系统的性能水平。
Jul, 2020
本文提出了一种实用于实际机器人任务 -- 如机器人操作 -- 的深度强化学习算法,并在无人监督的情况下使用自我监督的基于模型的方法来训练预测模型,通过选择指定像素、目标图像或图像分类器作为目标设定方法,探索实现前所未见的任务和物体的普遍泛化。
Dec, 2018
提出了一种基于强化学习和元学习的框架来解决 few-shot learning 问题,通过稳定的损失函数来学习最佳的优化算法,从而实现了对参数的更新。实验结果表明该方法在准确率和 NDCG 指标上均超过了现有的替代方法,并且可扩展到网络结构搜索。
May, 2020
该研究使用深度强化学习方法,通过增量构建语义地图和选择长期目标来实现目标导航,并通过数据增强和 Q 函数正则化等方法明显提高了模型性能。
Aug, 2022
该研究探讨了如何通过学习一个机器人策略来遵循自然语言指令,从而轻松地将其扩展以推理新对象,并介绍了一个基于数据增强的少量学习语言条件对象基础方法,以识别对象并将其与指令中的对象匹配。然后,将其整合到遵循指令的策略中,从而使其能够通过添加样例来推理出先前未见过的对象。经过评估,该方法在测试时比现有技术水平表现得更好,即使先前的方法在训练过程中观察到所有的对象。
Nov, 2020
本文提出了使用自回归进行离线机器人技能学习,并通过先前的数据学习环境的形式理解,该方法可以处理高维相机图像,可以学习到许多技能,并通过一系列技术进行训练,此方法具有较强的泛化能力,可以在多个目标之间进行目标链接,通过预训练或辅助目标学习到丰富的表示。
Apr, 2021
本研究提出一种元模仿学习方法,通过深度神经网络对机器人进行高效学习,使机器人能够从一个单独的示例中获取新技能,并能够终端到端地学习。实验结果表明,该方法能够扩展到原始像素输入,并且需要较少前置任务数据,具有广泛的应用前景。
Sep, 2017