探索因果世界:通过知识转移和课程学习增强机器人操纵能力
本文介绍了一个强化学习算法,用于在不同形态的机器人中传递知识并实现多种技能的学习。模拟实验结果表明,我们可以在不同连接数和肌腱驱动和扭矩驱动机器人的模拟环境中传递知识和技能。
Mar, 2017
本文介绍了使用基于图形的关系结构从简单的任务中学习并实现复杂的机器人操作任务,使用了强化学习方法并在喂入少量数据的情况下超越现有的最先进方法,同时也实现了零样本泛化。
Dec, 2019
该研究提出CausalWorld,考虑了因果结构和迁移学习的机器人操作环境的基准。提供了具有共同因果结构和潜在因素的组合任务,这些任务可以用于训练和评估,以实现在不同任务分布之间的相似性,并具有迁移到真实世界的可能性。
Oct, 2020
本文介绍一种基于预定义行为模块的学习框架Manipulation Primitive-Augmented Reinforcement Learning(MAPLE),通过这种学习框架实现机器人在多种实际操作任务中表现出色,MAPLE 具有超越基线方法的性能。
Oct, 2021
本研究结合课程学习和域随机化方法,探究如何快速应用于机器人接触式操作任务中,实现在工业装配等领域中的快速学习和短时间内达到高成功率。研究结果表明,本文所提出的方法在工业插入任务中取得了最多86%的成功率,并且使用样本训练的时间不到以往的五分之一。
Apr, 2022
该论文介绍了一种基于深度强化学习的方法,其中使用奖励函数、经验重放和知识迁移等技术使机器人学会在模拟和真实环境中进行高效的三指夹爪操作,实现了对立方体的目标导向运动和姿态控制。
May, 2022
本文介绍了一种基于多个技能先验的强化学习方法,通过学习每个任务所需技能的先验分布,并将任务的相似性与先前的任务进行比较,以指导在新任务上学习策略,从而更好地推广到训练中从未遇到的新任务。
Sep, 2022
通过引入Continual Policy Distillation(CPD)框架,该研究介绍了一种实现多功能控制器的方法,以用于四指软抓手对不同形状和大小的物体进行旋转操作的柔性机器人手。该框架利用策略蒸馏(PD)从专家策略向不断发展的学生策略网络传递知识,并集成样本回放方法以增强泛化能力和避免灾难性遗忘。研究结果表明,CPD框架在整合多个专家知识和实现多功能自适应手部操作任务方面具有较好的性能。
Apr, 2024
通过研究学习曲线、触觉反馈及球体举起和旋转等因素对灵巧操控学习策略的影响,我们发现课程学习是决定灵巧操控特征习得的重要因素,同时也挑战了对触觉信息在灵巧操控任务中的必要性的传统假设。
Jul, 2024
本研究解决了机器人操作中技能学习的挑战,提出了一种新颖的技能学习方法,通过自动生成大量多样化任务来发现可组合的行为。研究结果表明,所学习的技能能帮助机器人稳健地与环境中的物体互动,并成功应用于未见的操作任务中,具有重要的实际应用潜力。
Oct, 2024