本研究探索了学习控制方法对于机械手进行非抓握性操作的影响,通过深度学习和最近邻等方法实现了控制器的泛化。研究表明仅基于时间轨迹的控制器仅需要少量训练数据即可构建,同时多个控制器可以进行插值形成更全局的控制器。
Nov, 2016
本文对于一种学习控制策略进行了系统分析,该策略主要包括估计系统动态模型和应用轨迹优化算法来降低目标成本,我们提出了一种基于本地线性模型的算法,在重要的问题参数上获得了多项式的样本复杂度,并通过合成本地稳定增益,克服了问题时间影响的指数依赖性,我们的实验结果也验证了该算法的有效性并与自然深度学习基线进行了比较。
May, 2023
本文提出了一种混合预测控制器,使用触觉信息和全身动力学来局部预测机器人的未来动作,实现了机器人快速生成灵活的运动。通过跟踪反馈策略,该预测控制器能够在没有使用单独的全身控制器的情况下执行低级扭矩控制。
Mar, 2022
通过模型无关的机器学习框架和储水计算方法,实现对双臂机器人操纵器的跟踪控制,仅使用部分观测状态,并且该控制框架在周期性和混沌信号方面表现出有效性和对测量噪声、干扰和不确定性的鲁棒性。
Sep, 2023
本研究提出了一种针对不确定控制仿射非线性系统的运动规划算法,在使用高维传感器测量(如 RGB-D 图像)和一个学习感知模块的反馈控制环路时保证运行时安全性和目标可达性。
Jun, 2022
通过提出基于频率的成本函数在轨迹优化中实现对于机器人模型误差的鲁棒性设计,从而增加运动规划的稳定性和兼容性。在通过模拟和硬件实验优化动作规划并在机器人 ANYmal 上进行实验后,成功地提高了机器人对于不确定环境和具有不同活动性的地形的适应性。
Sep, 2018
本文提出了一种基于收缩反馈的运动规划方法,通过学习动力学的深度控制函数逼近,建立了在未知动力学系统中的安全交互方式, 包括控制器优化和轨迹跟踪, 并在高维度的动力学系统中进行了验证。
Apr, 2021
使用基于数据的控制法律,通过高斯过程回归来补偿系统未知的动力学,并基于学习的模型的不确定性来自适应反馈部分的增益,以保证全局有界跟踪误差。
Nov, 2018
本文提出了一种通过策略搜索学习复杂的反馈控制策略的方法,该策略可将高维度感知输入映射到电机扭矩以执行具有不连续性接触动力学的操纵任务,该方法在使用先前的技术基础上进行了改进,使用了基于 PI2 的无模型本地优化器和使用 on-policy 抽样来训练针对一系列任务实例的复合全局策略,从而实现了直接从视觉输入执行扭矩控制的深度神经网络策略。
Oct, 2016
本文介绍了一种基于协同在线学习框架的方法,通过给机器人提供用户轨迹的偏好反馈而不是直接演示最优轨迹来教授其物体操作任务,理论上说明了该方法的可行性并在多项超市结帐任务中验证了其普适性。
Jun, 2013