本文探讨了分布式异步策略学习作为实现机器人具备普适性和提高复杂任务训练效率的手段。实验证明,使用这种方法可以提高机器人对任务的泛化、利用和训练时间效率,从而在视觉门开启任务中取得更好的效果。
Oct, 2016
本文提出并分析了一种基于任务导向探索的框架,该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数,并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明,任务导向的探索有助于在系统参数未知时,使基于模型的策略适应更好,从而实现更好的任务表现。
Jun, 2020
本研究提出了一种基于数据驱动的联合人机系统的共享控制范式,旨在不限制用户的能力以实现未指定的行为,大幅提高系统安全性和用户满意度。
Jun, 2019
本文提出了一个更加通用的解决方案来解决强化学习中的鲁棒性问题,设计了一种算法,该算法结合了系统识别和鲁棒强化学习的优点,解决在不同情况下的不确定性问题,并在多个控制任务中获得了比之前方法更好的最坏情况执行性能。
Feb, 2022
通过利用少量真实世界数据来自动完善模拟模型并规划准确的控制策略,在多个具有挑战性的机器人操作任务中,我们展示了这种模式对识别关节、质量和其他物理参数的有效性,并且说明了只需少量真实世界数据即可进行有效的模拟到真实世界的转换。
Apr, 2024
用简单的线性和 RBF 参数编制的策略可以训练和解决多种连续控制任务,性能与使用更复杂的参数编制(如全连接神经网络)得到的最新结果相当。采用不同的初始状态分布进行训练可以产生更好的泛化全局策略,从而允许系统从大的在线扰动中恢复。
Mar, 2017
通过多任务强化学习方法,本文在真实机器人上实现了视觉导向控制策略的快速训练技术,并在模拟和真实世界的 Ball-in-a-Cup 游戏中进行了测试。
Feb, 2019
本文提出了一种通过策略搜索学习复杂的反馈控制策略的方法,该策略可将高维度感知输入映射到电机扭矩以执行具有不连续性接触动力学的操纵任务,该方法在使用先前的技术基础上进行了改进,使用了基于 PI2 的无模型本地优化器和使用 on-policy 抽样来训练针对一系列任务实例的复合全局策略,从而实现了直接从视觉输入执行扭矩控制的深度神经网络策略。
使用视觉、用户意图推断和人机共同控制的框架,旨在解决机器人远程操作系统中的挑战,同时缓解大脑 - 计算机接口下的噪音和错误低维度运动指令问题。我们使用共同控制辅助框架对两个使用了颅内脑机接口的受试者进行实验,并取得了显着的性能提升,在门的开启、从容器中倒液体和在密集且杂乱的环境中使用新型物品等任务中进一步展示了我们架构的可扩展性。
Mar, 2015
从异构数据中训练通用机器人策略,使用 Policy Composition 方法将不同模态和领域的数据结合起来,学习场景级和任务级的广义操作技能,实现对多任务操作的灵活综合和推理时策略行为的自适应。在模拟和真实世界实验中,该组合策略在不同场景和任务下实现了稳健和灵巧的性能,并优于单个数据源的基线结果。
Feb, 2024