这篇论文旨在介绍模仿学习(IL)及其基本假设和方法,提供领域内最新进展和新兴研究的详细描述,讨论了解决模仿学习相关挑战的常见方法,并提出未来研究的潜在方向,全面指导机器人和人工智能领域中日益增长的模仿学习研究。
Sep, 2023
通过模仿学习,我们能够快速理解一个新任务,通过演示,我们可以直接获得哪些动作需要执行以及它们的目标的知识。本文介绍了一种新的模仿学习方法,解决了机器人模仿人类所面临的视角变化和身体模式等挑战。我们的方法可以利用单个人类演示来抽象展示任务的信息,并利用该信息进行泛化和复制。我们通过两种最先进的方法进行了新的集成:扩散式动作分割模型用于抽象演示的时间信息,以及开放词汇对象检测器用于空间信息。此外,我们通过符号推理来改进抽象的信息,并利用逆向运动学创建行动计划,以使机器人能够模仿演示的动作。
Jan, 2024
本文旨在为 Imitation Learning 的算法提供广泛的综述,对这些算法的主要特征进行介绍,并在性能和遗憾界限上进行比较。
Jan, 2018
本文研究应用 Imitation Learning 和 transfer learning 方法解决 Duckietown 场景下的机器人车道跟踪问题,并通过 sim-to-real 方法进行实际环境迁移,最终比较了三种 Imitation Learning 方法和两种 sim-to-real 方法的优缺点。
Jun, 2022
本研究提出了一种基于视频预测、上下文转换和深度强化学习的 “观察型模仿学习” 方法,该方法消除了标准模仿学习对于完全相同环境的假设,并能够从一个演示者的视频中学习各种现实世界中的机器人技能,涵盖扫地、铲杏仁、推物品等家庭琐事任务以及模拟中的许多其他任务。
Jul, 2017
本文介绍了一种基于序列归纳偏置的,从专家轨迹的状态中模仿复杂机器人任务并实现优化的新算法,将复杂任务拆分成较小的技能,将技能训练为 (goal-conditioned policy),以便能够逐个解决每个技能并连接技能以完成整个任务,同时证明了该方法经过了无须几个未经过训练的样例即可实现了非完整导航任务和复杂的仿真机器人操作任务。
Apr, 2022
模仿学习的文献内容进行了系统回顾,通过引入新的分类法对模仿学习技术、环境和度量进行了分类,反思了文献中的主要问题,并提出了研究者面临的挑战和未来发展方向。
Apr, 2024
本研究提出了一种基于模仿学习的系统,使机器人可以通过模仿真实世界的动物学习敏捷的运动技能,并演示了该系统的有效性。
Apr, 2020
本研究旨在通过利用更强大的信息源和从现有数据中提取更多信息的方式,增加数据收集与维护流水线的效率,并着重解决模仿学习、领域自适应和从模拟中进行传输等三个正交方面的问题。
Apr, 2019
本文提出和研究了一种隐含模仿的形式模型,通过观察导师,强化学习代理可以提取关于其自身能力和状态空间中未访问部分的相对价值的信息,并阐述了隐含模仿的好处,通过指导单个和多个导师来证明性能和收敛性有所提高。
Jun, 2011