本文介绍使用干预性策略学习的方法来解决机器人操作任务中必须经过精确定序的地方的问题,提出一种 6 自由度机器人操作任务的数据采集系统,并开发了一个简单而有效的算法来收集新数据以遍历通过这些难点,使用干预策略学习的代理在机器人的线路穿线任务和制造咖啡任务中的表现优于其他多种基线算法。
Dec, 2020
为了确保机器人等自主车辆的广泛部署,本文提出了一种新的闭环范式用于综合安全控制策略,明确考虑系统在可能的未来情景下的演变不确定性,通过物理动力学和机器人的学习算法共同推理,利用对抗深度强化学习进行放大,展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。
Sep, 2023
本研究旨在通过利用更强大的信息源和从现有数据中提取更多信息的方式,增加数据收集与维护流水线的效率,并着重解决模仿学习、领域自适应和从模拟中进行传输等三个正交方面的问题。
Apr, 2019
本文研究了感知系统的运行时监测,提出了一个基于诊断图的故障检测和识别框架,并提供了一系列基于诊断图的算法来执行故障检测和识别。通过实验证明提出的系统监控具有潜在的在现实自动驾驶场景中预防事故的能力,并且计算负载极小。
May, 2022
本研究模拟机器人学习算法为动态系统,控制为机器人观察到的人类数据,利用可达性分析和最优控制解决机器人在线学习参数的安全问题,并在自主驾驶和室内导航等四个领域展示了其实用性。
Mar, 2021
本论文提出一种基于无标注训练数据的方法,结合深度动作条件视频预测模型和模型预测控制,使真实机器人能够进行非抓取操作,比如推动物体,并且可以处理训练过程中没有出现过的新物体。
Oct, 2016
基于深度强化学习的自主学习系统在创建具有韧性和高效的网络物理能源系统方面已经确立其基础。然而,大部分现有方法存在两个明显问题:现代无模型算法,如软 Actor Critic,需要大量样本才能学习有意义的策略,并且需要用来对抗概念漂移(如灾难性遗忘)的备用方案。本文介绍了一种将基于模型的深度强化学习与模仿学习相结合的混合代理体系结构的工作进展,以克服这两个问题。
Apr, 2024
通过使用基于大型语言模型的规划器,我们克服了当前固定技能集的限制,提出了一种用于数据和时间高效教授机器人这些技能的方法,该系统可以重复使用新习得的技能,展示了开放世界和终身学习的潜力。
通过应用深度学习方法,本研究论文考虑在干扰和测量噪声的存在下增强神经网络控制的非线性系统的运行时安全性。设计了一个稳健稳定的区间观测器,用于为神经网络、非线性函数和系统状态生成确切的下界和上界。所获得的区间用于实时监控系统安全性并检测系统输出或执行器中的故障。通过模拟自适应巡航控制车辆系统,演示了提出设计的有效性。
Mar, 2024
本文介绍了一种基于机器人学习的新框架 ——Sirius,通过人机分工实现了安全部署和复杂任务的有保障合作,并且利用了一种新的学习算法 —— 基于加权行为克隆技术,在模拟环境和真实硬件上均表现出色。
Nov, 2022