- 带初始热启动的偏微分方程控制的政策优化
通过增加策略优化步骤,将模型控制器与降维模型相结合,实现对混沌行为的偏差建模误差补偿,提高模型控制器性能。
- 安全过滤器:自主系统中安全关键控制的统一视角
安全过滤器方法综述,提供了一个统一的技术框架,以理解、比较和结合现有技术,为下一代自主机器人的部署提供更可扩展的综合、鲁棒性监测和高效干预的方向。
- 面向参数变化系统的模型自适应强化学习控制中的样本高效迁移
本文利用模型控制的思想解决了强化学习算法的样本效率问题,并通过四个基准实例验证了其性能。
- 四足机器人运动的扭矩控制学习
本研究探索了一种基于扭矩的强化学习框架,此模型成功验证了对于模型控制四足动物而言,相较于基于位置的强化学习方法,基于扭矩的强化学习方法能够产生更好的奖励和更强的抗干扰能力,并能够使四足动物在各种地形上移动,是关于四足机器人端到端学习扭矩控制 - ICLR破解哈密顿神经网络的归纳偏差
研究物理启发的神经网络的诱导偏差及其应用。表明与常规认识相反,通过直接建模加速度避免人工坐标系的人工复杂性,而不是辛结构或能量守恒,改善了 HNN 的广义性能。在实际中,通过放松这些模型的诱导偏差,可以在能量守恒系统上匹配或超过其性能,同时 - ICLR针对连续控制评估基于模型的规划和规划器分摊
本文探讨了基于模型的控制方法是否能够超越基于数据的方法。研究人员通过将模型预测控制与学习模型和基于数据的策略学习相结合的方式,对多种具有挑战性的运动任务进行了评估,并发现:经过良好调节的基于数据的策略学习代理是高自由度控制问题的强基准。但是 - MM刚体动力学的结构化学习:从机器人学角度的调查和统一视角
本文综述了一些通过将数据驱动建模与先前的解析知识相结合的监督回归模型,以在具有刚体力学描述的系统动力学建模中提高数据的效率和物理完整性,并分析了刚体力学的各种潜在函数和算子。
- NeuralSim:用神经网络增强可微分模拟器
本文介绍了一种基于神经网络的不同 iable rigid-body 物理引擎来学习动力学关系以及对其进行自动发现,替代了常规的解析式建模,使用神经网络能加速基于模型的控制架构,提高建模和控制的准确度。
- 无限时间预测的生成时序差分学习
本文介绍了 γ 模型 —— 一种具有无限概率时间的预测环境动态模型。它能够代替常规的单步模型,进一步通用模型控制、模型展开和基于模型价值评估等过程。该模型通过生成式时间差分学习进行训练,是状态衍生表示的连续自然模拟,并结合了无模型和基于模型 - 为实现稳健高效的腿式运动而学习接触自适应控制器
本研究提出了一个层次框架,将基于模型的控制和强化学习相结合,为四足动物(Unitree Laikago)合成鲁棒控制器。通过学习选择一套原语响应环境中的变化,使其适应复杂的环境变化,并具有更高的能源效率和更强的鲁棒性。
- ICML具有确定等效 EM 的部分观测系统的可扩展识别
本文介绍了利用欧几里德最大化的确定性等效逼近作为块坐标升方法的离线识别部分非线性系统的方法,通过试验验证该方法可靠且可扩展,可用于常见于机器人学中的高维确定性系统识别。
- 面向结构化物体感知的视频建模和规划中的物理预测
本文提出了一种名为 STOVE 的新颖状态空间模型,用于从视频数据中无监督地学习物体、位置、速度和相互作用模型,以及在模型为基础的控制任务中作为模拟器的优异性能,其中模型在推断过程中重用了动态模型,加速和规范了训练过程。
- ICLR深度 Lagrangian 网络:以物理学为深度学习的模型先验
使用理论物理知识,以很少的数据为样本,提出了一种新的深度学习方法 Deep Lagrangian Networks (DeLaN),可用于机器人轨迹跟踪控制,能够在实时学习中更快速,更准确地进行模型学习, 并能更加可靠地对新的轨迹进行外推
- 用于欠驱动系统的能量势控制端到端深度 Lagrangian 神经网络学习
应用深度学习于机器人控制的方法可以提高设计机器人控制定律的智能性,本文提出了一种深度控制的方法,通过扩展 DeLaN 网络到能源控制上实现了通过泛化函数逼近进行的能源控制的学习,该方法在 Furuta 摆控制方面表现出优异的实时控制性能。
- ICLR使用主动推理的贝叶斯策略选择
该论文研究了基于自由能原理的主动推理对机器学习中的强化学习和示范学习问题的解决,并将此概念应用于标准问题山车问题,结果表明主动推理可以涵盖强化学习和示范学习技术。
- 将最优控制与学习相结合,用于新颖环境的视觉导航
通过将模型驱动控制与基于学习的感知相结合,本研究提出了一种适用于未知场景下机器人导航的方法,实验结果表明,相比于几何映射和终端学习方法,该方法在处理复杂环境下的目标到达更加可靠和高效。本方法不依赖于对环境的详细、明确的 3D 地图,适用于低 - 面向部分观测的基于模型的控制传播网络
本文介绍了 PropNet—— 一种可学习的动力学模型,能够在部分可观测场景下进行模型控制,并实现信号的即时传播。实验结果表明,与其他学习物理引擎相比,PropNet 的前向模拟性能更好,在各种控制任务中也表现出更高的性能。与现有的模型无深 - ICLR神经网络优化控制:凸逼近方法
本文介绍使用凸神经网络实现模型精确度和控制可行性之间的平衡,通过设计凸性的循环神经网络来捕获动态系统的时态行为,并且可以通过解决凸问题来实现最优控制器。实验结果表明,该方法在控制应用中具有良好的潜力。
- ICLR时序差分模型:无模型深度强化学习用于模型控制
介绍了一种可以用于模型无关学习和模型控制的基于目标条件的价值函数,称为时间差分模型,它可以利用状态转移的丰富信息来非常高效地学习,同时达到超过直接基于模型的 RL 方法的渐近性能的实验结果表明,在一系列连续控制任务中,TDM 相比最先进的模 - 基于线性矩阵不等式的惯性参数物理一致性辨识:对质量分配的统计视角
该研究论文探讨了在机器人系统中运用惯性参数的建模和识别方法,提出了一种基于线性矩阵不等式的物理一致性约束方法,能够提高收敛速度和抵抗噪声干扰,并且通过标准半定规划实现对底盘组件的参数优化。