- 机器人操作的端到端操作能力学习
本研究使用视觉契合技术,通过预测关键点的接触信息,提出了一种端到端的控制策略学习框架,可以实现在不同类型的操纵任务中的泛化。结果显示,我们的算法在成功率上大大优于基线算法,包括基于视觉契合和强化学习方法。
- 野外场景下人机模仿
提出了一种名为 WHIRL 的算法,该算法采取第三人称的视角从人类被动、非结构化的数据中提取出先验,并使用其初始化代理的策略,同时引入了有效的现实世界策略学习方案和探索方法,能在真实环境下成功地学习人类模仿机器人,并完成 20 种不同的操作 - 利用语言加速学习工具操作
本文研究了在不同工具的属性和可利用性方面进行强大而广泛的工具操作所需的信息。通过获取各种工具的自然语言描述并使用预先训练的语言模型生成它们的要素表示,我们进行了语言条件的元学习,从而学习可以根据相应文本描述高效适应新工具的策略。我们的结果表 - 利用神经可行性检查加速集成任务和运动规划
本研究介绍了利用卷积神经网络来训练神经可行性分类器(NFC),实现自动分类任务计划中提出的动作方案的可行性,从而在多步操作任务中有效降低规划时间。
- 利用线性关系网络进行组合多对象强化学习
本文提出一种基于关系归纳偏见的新型插入式模块,可使代理程序在学习固定的多对象设置中学习操作任务,并在输入对象数量改变时零样本泛化,解决了前人方法因其复杂度而无法泛化的问题。
- 神经描述符域:SE(3)- 等变物体表征用于操作
提出了神经描述器场(NDF),一种通过类别级别描述符编码物体和目标(例如机器人夹子或挂架)之间的点和相对姿态的物体表示。通过自我监督学习 3D 自编码任务来方便地训练 NDFs,并将其用于从少量示范中学习物体操作任务,具有跨越所有可能的 3 - 如果我错了请纠正我:机器人操纵的交互学习
提出一种交互学习框架 CEILing,利用来自人类教师的纠正和评估反馈,来训练一个随机策略,从而有效地解决了机器人在视觉观测中进行复杂动作操作的问题。
- 使用几何和符号场景图进行长时程操作的分层规划
我们提出了一种基于视觉的分层规划算法,利用神经符号任务规划和基于低级运动产生的联合框架,以指定目标为条件。该算法使用两级场景图形式来表示操作场景,即几何场景图和符号场景图,并使用图形神经网络来为高层任务规划和低层动作生成处理这些场景图。我们 - 学习机器人技能组合模型,用于任务和动作规划
该研究旨在通过学习使用感知运动基元来解决复杂的长期规划操作问题,其需要将基本技能组合成新的技能来推广应用于广泛的问题中,同时使用高效的主动学习和采样方法,将学习和规划方法结合来规划各种复杂的动态操作任务。
- 变形和刚体物体操作视觉动作规划的潜空间路线图
本文提出了一个基于图形结构的框架,包含可视化预测模块及提案网络模块,利用低维潜在空间进行常规复杂操作的动作计划,验证了在模拟环境和实际机器人中制定可行的任务完成方案及操作计划。
- 基于关系强化学习实现实用的多物体操作
本文介绍了使用基于图形的关系结构从简单的任务中学习并实现复杂的机器人操作任务,使用了强化学习方法并在喂入少量数据的情况下超越现有的最先进方法,同时也实现了零样本泛化。
- 基于视觉的灵巧机械手臂系统远程操作
本研究设计了一个低成本的基于视觉的遥操作系统 DexPilot,透过观察裸露的人手简单操作即可完全控制拥有 23 个 DoA 的机器人系统,能够执行各种复杂的操作,收集高维度、多模态的状态 - 行动数据,为未来学习挑战性操作任务的感觉运动策 - 通过逆物理推理推断混杂环境中未知刚性物体的三维形状
本研究提出了一种概率建模方法,用于在机器人操纵过程中实时建立三维物体模型,可应用于未知物体的操纵任务,利用物理引擎进行验证和推断,显著提高了模型准确性。
- 逆向课程生成用于强化学习
本文提出了一种基于逆向强化学习的方法,用于训练机器人完成目标导向任务,该方法自动生成适应智能体表现的初始状态课程,即使面对目前最先进的强化学习方法无法解决的困难仿真导航和纤细操纵问题也可取得显著成果。
- 学习表征部分可观测任务的触觉反馈
本文提出了一种将触觉感知反馈模型建模成部分可观察 Markov 决策过程并利用深度递归神经网络优化来进行任务操作的方法,其可以用于完成机械臂旋转旋钮等多种指定任务。
- 路径积分导向的策略搜索
本文提出了一种通过策略搜索学习复杂的反馈控制策略的方法,该策略可将高维度感知输入映射到电机扭矩以执行具有不连续性接触动力学的操纵任务,该方法在使用先前的技术基础上进行了改进,使用了基于 PI2 的无模型本地优化器和使用 on-policy - 在线动态适应和神经网络先验的一次性操作技能学习
本研究提出了一种基于模型的强化学习算法,将以前任务的先验知识与在线动态模型适应相结合,实现了高效学习,并且成功地应用于各种复杂机器人操纵任务。
- 深度视觉动作策略的端到端训练
该研究旨在回答:联合端到端训练感知和控制系统是否比单独训练每个组件提供更好的性能?通过使用卷积神经网络表示,并在一系列需要视觉和控制之间紧密协作的真实世界操纵任务上进行评估。