推 GENERALIZED ASSISTIVE 控制的并发策略融合与系统识别

May, 2022

推 GENERALIZED ASSISTIVE 控制的并发策略融合与系统识别

Concurrent Policy Blending and System Identification for Generalized Assistive Control

Luke Bhan, Marcos Quinones-Grueiro, Gautam Biswas

TL;DR通过将系统辨识与同时策略混合相结合，创建出对参数变化有鲁棒性的泛化策略，提高了协作机器人的效率。

Abstract

In this work, we address the problem of solving complex collaborative robotic tasks subject to multiple varying parameters. Our approach combines simultaneous policy blending with system identification to create

collaborative robotics system identification policy blending parameter changes efficiency

发现论文，激发创造

集体机器人分布式异步引导策略搜索强化学习

本文探讨了分布式异步策略学习作为实现机器人具备普适性和提高复杂任务训练效率的手段。实验证明，使用这种方法可以提高机器人对任务的泛化、利用和训练时间效率，从而在视觉门开启任务中取得更好的效果。

Oct, 2016

学习主动任务导向的探索策略，弥合模拟与现实之间的差距

本文提出并分析了一种基于任务导向探索的框架，该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数，并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明，任务导向的探索有助于在系统参数未知时，使基于模型的策略适应更好，从而实现更好的任务表现。

Jun, 2020

基于数据驱动的高度并行化最小干预共享控制 MPC

本研究提出了一种基于数据驱动的联合人机系统的共享控制范式，旨在不限制用户的能力以实现未指定的行为，大幅提高系统安全性和用户满意度。

Jun, 2019

多重不确定性集合上的鲁棒策略学习

本文提出了一个更加通用的解决方案来解决强化学习中的鲁棒性问题，设计了一种算法，该算法结合了系统识别和鲁棒强化学习的优点，解决在不同情况下的不确定性问题，并在多个控制任务中获得了比之前方法更好的最坏情况执行性能。

Feb, 2022

ASID：机器人操作中的系统辨识主动探索

通过利用少量真实世界数据来自动完善模拟模型并规划准确的控制策略，在多个具有挑战性的机器人操作任务中，我们展示了这种模式对识别关节、质量和其他物理参数的有效性，并且说明了只需少量真实世界数据即可进行有效的模拟到真实世界的转换。

Apr, 2024

连续控制中的泛化和简洁性

用简单的线性和 RBF 参数编制的策略可以训练和解决多种连续控制任务，性能与使用更复杂的参数编制（如全连接神经网络）得到的最新结果相当。采用不同的初始状态分布进行训练可以产生更好的泛化全局策略，从而允许系统从大的在线扰动中恢复。

Mar, 2017

同时学习视觉和基于特征的控制策略，应用于现实世界的杯中球游戏

通过多任务强化学习方法，本文在真实机器人上实现了视觉导向控制策略的快速训练技术，并在模拟和真实世界的 Ball-in-a-Cup 游戏中进行了测试。

Feb, 2019

路径积分导向的策略搜索

本文提出了一种通过策略搜索学习复杂的反馈控制策略的方法，该策略可将高维度感知输入映射到电机扭矩以执行具有不连续性接触动力学的操纵任务，该方法在使用先前的技术基础上进行了改进，使用了基于 PI2 的无模型本地优化器和使用 on-policy 抽样来训练针对一系列任务实例的复合全局策略，从而实现了直接从视觉输入执行扭矩控制的深度神经网络策略。

Oct, 2016

具有自主性的远程操作，应用于脑机接口操纵

使用视觉、用户意图推断和人机共同控制的框架，旨在解决机器人远程操作系统中的挑战，同时缓解大脑 - 计算机接口下的噪音和错误低维度运动指令问题。我们使用共同控制辅助框架对两个使用了颅内脑机接口的受试者进行实验，并取得了显着的性能提升，在门的开启、从容器中倒液体和在密集且杂乱的环境中使用新型物品等任务中进一步展示了我们架构的可扩展性。

Mar, 2015

PoCo: 来自和为异构机器人学习的政策组合

从异构数据中训练通用机器人策略，使用 Policy Composition 方法将不同模态和领域的数据结合起来，学习场景级和任务级的广义操作技能，实现对多任务操作的灵活综合和推理时策略行为的自适应。在模拟和真实世界实验中，该组合策略在不同场景和任务下实现了稳健和灵巧的性能，并优于单个数据源的基线结果。

Feb, 2024