通过分段仿射逼近实现灵巧操作的本地轨迹稳定化

Sep, 2019

通过分段仿射逼近实现灵巧操作的本地轨迹稳定化

Local Trajectory Stabilization for Dexterous Manipulation via Piecewise Affine Approximations

Weiqiao Han, Russ Tedrake

TL;DR我们提出了一个基于模型的方法来设计巧妙的机器人操作反馈策略，利用轨迹优化找到可行的轨迹，并使用多面体构建线性化轨迹的漏斗以及在线执行时解决线性问题以跟踪系统轨迹。

Abstract

We propose a model-based approach to design feedback policies for dexterous robotic manipulation. The manipulation problem is formulated as reaching the target region from an initial state for some non-smooth non

model-based approach feedback policies dexterous robotic manipulation trajectory optimization polytopes

发现论文，激发创造

从经验和模仿中学习灵巧的操作策略

本研究探索了学习控制方法对于机械手进行非抓握性操作的影响，通过深度学习和最近邻等方法实现了控制器的泛化。研究表明仅基于时间轨迹的控制器仅需要少量训练数据即可构建，同时多个控制器可以进行插值形成更全局的控制器。

Nov, 2016

非线性策略优化中学习本地线性模型的威力

本文对于一种学习控制策略进行了系统分析，该策略主要包括估计系统动态模型和应用轨迹优化算法来降低目标成本，我们提出了一种基于本地线性模型的算法，在重要的问题参数上获得了多项式的样本复杂度，并通过合成本地稳定增益，克服了问题时间影响的指数依赖性，我们的实验结果也验证了该算法的有效性并与自然深度学习基线进行了比较。

May, 2023

四足机器人的敏捷机动：一种预测控制方法

本文提出了一种混合预测控制器，使用触觉信息和全身动力学来局部预测机器人的未来动作，实现了机器人快速生成灵活的运动。通过跟踪反馈策略，该预测控制器能够在没有使用单独的全身控制器的情况下执行低级扭矩控制。

Mar, 2022

无模型的复杂动态轨迹跟踪控制与机器学习

通过模型无关的机器学习框架和储水计算方法，实现对双臂机器人操纵器的跟踪控制，仅使用部分观测状态，并且该控制框架在周期性和混沌信号方面表现出有效性和对测量噪声、干扰和不确定性的鲁棒性。

Sep, 2023

基于学习感知模块和压缩理论的图像安全输出反馈运动规划

本研究提出了一种针对不确定控制仿射非线性系统的运动规划算法，在使用高维传感器测量（如 RGB-D 图像）和一个学习感知模块的反馈控制环路时保证运行时安全性和目标可达性。

Jun, 2022

频率感知模型预测控制

通过提出基于频率的成本函数在轨迹优化中实现对于机器人模型误差的鲁棒性设计，从而增加运动规划的稳定性和兼容性。在通过模拟和硬件实验优化动作规划并在机器人 ANYmal 上进行实验后，成功地提高了机器人对于不确定环境和具有不同活动性的地形的适应性。

Sep, 2018

通过学习的压缩度量，对未知系统进行安全反馈运动规划中的模型误差传播

本文提出了一种基于收缩反馈的运动规划方法，通过学习动力学的深度控制函数逼近，建立了在未知动力学系统中的安全交互方式，包括控制器优化和轨迹跟踪，并在高维度的动力学系统中进行了验证。

Apr, 2021

基于稳定高斯过程的 Lagrangian 系统跟踪控制

使用基于数据的控制法律，通过高斯过程回归来补偿系统未知的动力学，并基于学习的模型的不确定性来自适应反馈部分的增益，以保证全局有界跟踪误差。

Nov, 2018

路径积分导向的策略搜索

本文提出了一种通过策略搜索学习复杂的反馈控制策略的方法，该策略可将高维度感知输入映射到电机扭矩以执行具有不连续性接触动力学的操纵任务，该方法在使用先前的技术基础上进行了改进，使用了基于 PI2 的无模型本地优化器和使用 on-policy 抽样来训练针对一系列任务实例的复合全局策略，从而实现了直接从视觉输入执行扭矩控制的深度神经网络策略。

Oct, 2016

通过迭代改进学习机械臂的运动轨迹偏好

本文介绍了一种基于协同在线学习框架的方法，通过给机器人提供用户轨迹的偏好反馈而不是直接演示最优轨迹来教授其物体操作任务，理论上说明了该方法的可行性并在多项超市结帐任务中验证了其普适性。

Jun, 2013