全球稳定的神经仿真策略

Mar, 2024

Globally Stable Neural Imitation Policies

Amin Abyaneh, Mariana Sosa Guzmán, Hsiu-Chin Lin

TL;DR通过引入稳定神经动力系统（SNDS），我们提出了一种保证稳定性的模仿学习方案，该方案通过联合训练策略和对应的 Lyapunov 候选者来构建具有正式稳定性保证的策略。我们在模拟环境中进行了广泛的实验并成功地将训练得到的策略部署于真实的机械臂，实验结果表明我们的方法解决了以往模仿学习方法中的不稳定性、准确性和计算强度问题，为复杂规划场景中的稳定策略学习提供了有希望的解决方案。

Abstract

imitation learning presents an effective approach to alleviate the resource-intensive and time-consuming nature of policy learning from scratch in the solution space. Even though the resulting policy can mimic ex

imitation learning stable neural dynamical system policy learning stability guarantees complex planning scenarios

发现论文，激发创造

通过自主神经动态策略实现端到端稳定的模仿学习

本文介绍了一种基于自主动力学系统的 Autonomous Neural Dynamic Policies（ANDPs），其优点在于比传统的稳定动力学系统策略更加灵活。实验结果表明 ANDPs 在几种模仿学习任务中表现出出色的灵活性和能力。

May, 2023

神经动态策略的端到端感觉 - 运动学习

该论文提出了一种新的策略表示 —— 神经动力学策略，通过将动力学系统嵌入到神经网络策略中，通过二阶微分方程来重新参数化动作空间以实现端到端的政策学习，并在几个机器人控制任务中展示了神经动态策略比传统的基于先验的策略学习方法更高的效率和性能表现。

Dec, 2020

记忆一致的神经网络用于模仿学习

模仿学习通过利用专家演示大大简化了策略合成，我们重新考虑了行为克隆样本便捷地训练策略，设计了对抗错误现象的模型类，使用 MCNN 策略在 9 个模仿学习任务上得到了显著的性能提升。

Oct, 2023

Lyapunov 神经网络：自适应稳定性认证用于动态系统的安全学习

本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法，以学习非线性闭环动力系统的准确安全证明，并在模拟倒立摆中演示了该方法的应用，讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。

Aug, 2018

模仿复杂轨迹：连接低层稳定性和高层行为

我们提出了一个理论框架，用于研究非马尔可夫、潜在多模态（即 “复杂的”）专家示范在非线性动力系统中的模仿。

Jul, 2023

具有逆动力学表示的稳健视觉模仿学习

我们提出了一种新颖的鲁棒模仿学习方法，通过发展逆动力学状态表示学习目标来对齐专家环境和学习环境，通过设计有效的奖励函数来度量行为数据和专家数据之间的相似性，从而在各种视觉扰动和视觉控制任务中实现近乎专家的性能，并显著优于当前最先进的视觉模仿学习方法和鲁棒模仿学习方法。

Oct, 2023

学习约束动力学的稳定神经微分方程

本文提出了一种基于稳定化术语的神经微分方程方法：稳定化神经微分方程，用于实现关于神经微分方程的约束条件，提出的方法简单易行，适用于常见的神经微分方程模型，并能够超越现有方法的应用范围。

Jun, 2023

随机系统中区域稳定控制策略的学习

论文研究了在随机系统中学习控制策略的问题，提出了新的稳定排名超级鞅（sRSMs）概念，并介绍了一个可以学习控制策略和 sRSMs 的学习过程，实验结果表明该过程可以成功地学习稳定性证明策略。

Oct, 2022

多领域任务导向对话的图神经网络策略及模仿学习

本研究使用基于图神经网络的结构化策略及不同程度的模仿学习，来有效地处理多领域对话，结果表明结构化策略优于标准策略。

Oct, 2022

基于反向模型的少量演示稳健仿真

本文提出了一种基于生成式反向动力学模型的行为克隆方法以解决自我学习表现不佳的问题，利用模型产生短期想象轨迹进行训练，提高了模型的健壮性和适应性。

Oct, 2022