基于 Koopman 不变子空间的非线性动态杆位置控制数据驱动端到端学习

Aug, 2022

基于 Koopman 不变子空间的非线性动态杆位置控制数据驱动端到端学习

Data-driven End-to-end Learning of Pole Placement Control for Nonlinear Dynamics via Koopman Invariant Subspaces

Tomoharu Iwata, Yoshinobu Kawahara

TL;DR本文提出了一种基于 Koopman 算符理论的数据驱动方法来控制黑盒非线性动态系统的频率和收敛速率，该方法利用一个策略网络来训练一个 Koopman 算符的特征值接近目标特征值，该策略网络由神经网络和极点配置模块组成，并使用增强学习以端到端的方式进行训练，结果表明该方法比无模型强化学习和基于模型的控制具有更好的性能。

Abstract

We propose a data-driven method for controlling the frequency and convergence rate of black-box nonlinear dynamical systems based on the koopman operator theory. With the proposed method, a →

nonlinear dynamical systems koopman operator policy network eigenvalues reinforcement learning

发现论文，激发创造

具备保证稳定性的非线性动态线性嵌入的物理知识概率学习

本文提出了一种基于测度理论的深度神经网络学习连续时间 Koopman 算子的方法，使用结构参数化来保证稳定性，并构建了一个自动编码器架构以学习动态模态分解的残差部分，并在基于贝叶斯方法的平均场变分推断下评估了该框架。

Jun, 2019

具有鲁棒稳定性和递归可行性保证的 Koopman 数据驱动预测控制

通过线性控制输入 Koopman 提升模型从输入 - 输出数据中设计数据驱动的非线性系统预测控制器，以学习最小化 Koopman 子空间预测器的多步输出预测误差的可观测量，并通过插值初始状态获得递归可行性保证和输入与状态稳定性保证。在文献综述中，通过非线性基准示例展示了 Koopman 数据驱动预测控制方法的性能。

May, 2024

非线性系统的计算高效数据驱动发现与线性表示

使用 Koopman 算子理论开发了一个基于数据驱动的框架，用于非线性系统的系统识别和线性化控制，采用递归学习的深度学习框架，并使用线性二次控制器对得到的线性系统进行控制。通过在噪声数据上进行仿真，我们展示了我们的方法相比自编码器基准更高效且更准确的训练结果。

Sep, 2023

学习组合 Koopman 算子用于基于模型的控制

本文提出了使用图神经网络对对象进行编码，使用分块的线性转移矩阵来规范化对象之间的共享结构，从而学习组合型 Koopman 操作符，以实现非定常系统的建模与控制。我们的实验结果表明，与现有的基线相比，所提出的方法具有更好的效率和泛化能力。

Oct, 2019

非线性动力学的通用线性嵌入的深度学习

本文利用深度学习，从动态系统的轨迹数据中发现 Koopman 特征函数的表示，提出了一种改进的自动编码器模型，可以识别非线性坐标，将动力学嵌入到低维流形上，并将 Koopman 表示推广到具有连续谱的系统。

Dec, 2017

学习 Koopman 不变子空间用于动态模态分解

该研究提出了一种基于数据驱动的 Koopman 谱分析方法，该方法通过最小化线性最小二乘回归的残差平方和来估计一组将数据转换为线性回归适合的形式的函数，并采用神经网络实现并在非线性动力系统及其应用中进行了实证评估。

Oct, 2017

学习稳定的 Koopman 嵌入

本文提出一种基于数据驱动的方法，利用 Koopman 嵌入将原始状态空间提升到更高的线性流形，从而学习非线性系统的稳定模型，并证明了该方法在离散时间下能够学习所有非线性收缩模型，在保证模型稳定性的同时允许对 Koopman 嵌入和算子进行无约束的优化，同时通过直接参数化稳定线性系统来极大地简化计算。我们还在模拟系统上验证了该方法，并分析了与替代方案相比的优势。

Oct, 2021

基于数据驱动的 Koopman 特征函数控制发现

这篇论文描述了使用 Koopman 算子及其特征函数进行非线性系统的控制的方法，并提出了基于数据驱动的降阶方法，证明了验证确定的特征函数的重要性并且说明了其在控制中的作用。

Jul, 2017

非参数控制 - Koopman 操作器学习：灵活可扩展的预测和控制模型

通过控制仿射再现内积核，我们提出了一种通用框架 —— 控制 Koopman 算子回归（cKOR），它允许直接估计单个算子，用于解决非线性控制仿射系统的 Koopman 算子表示的学习问题，并且通过利用随机投影（sketching）增强了控制 - Koopman 算子估计器的可扩展性。

May, 2024

基于深度 Koopman 表达的策略学习

本文提出了一种基于 Koopman 算子理论和策略梯度方法的政策学习算法，该算法将未知动态系统的线性逼近和最优政策搜索相结合，引入所谓的深度 Koopman 表示来提高数据效率，并应用贝尔曼最优原理来避免逼近系统动态引起的长期任务的累积误差，同时提供理论分析以证明所提出算法的渐近收敛性和采样复杂度。

May, 2023