神经时间反演广义瑞克蒂方程

Dec, 2023

Neural Time-Reversed Generalized Riccati Equation

Alessandro Betti, Michele Casoni, Marco Gori, Simone Marullo, Stefano Melacci...

TL;DR本文介绍了一种新颖的基于神经网络的最优控制方法，该方法旨在通过在时间上前进来实现最优控制。神经网络不仅用于实施状态动态，还用于估计共轭变量。通过引入一种新的局部策略，即时间反转的广义 Riccati 方程，来确定后一网络的参数。通过讨论一系列最优控制案例研究的实验结果，我们支持这个猜想，即这个策略能够稳定状态动态。

Abstract

optimal control deals with optimization problems in which variables steer a dynamical system, and its outcome contributes to the objective function. Two classical approaches to solving these problems are Dynamic Programming and the Pontryagin Maximum Principle. In both approaches,

optimal control neural-based approach hamiltonian equations costate variables local policy

发现论文，激发创造

最优控制理论的路径积分和对称性破缺

本文讨论了非线性动态系统的线性二次控制问题，并将其转化为线性方程。通过使用路径积分方法，解决了传统反向计算的问题，并给出了路径积分方法的有效计算方法，如 MC 抽样、Laplace 逼近和变分逼近。通过例子来说明了随机和确定性控制的区别以及噪声的对称性破坏现象的发生。

May, 2005

深度多任务神经网络解决一些随机最优控制问题

本研究论文采用多任务神经网络的有效解法，通过数值实验，证明其在处理实际金融衍生品定价问题上优于现有方法。

Jan, 2024

一个 Q 学习算法用于具有随机未知分布参数的离散时间线性二次控制：收敛和稳定性

本文针对离散时间线性系统和二次标准的随机参数情况，提出一种基于 Q-learning 精神的在线迭代算法来求解这个无限时间视角下的最优控制问题。第一定理证明了学习序列的收敛性、控制问题的良态性和代数 Riccati 方程的解的可解性三个属性的等价性。第二定理证明了在控制问题得到良态的前提下，学习序列的自适应反馈控制可以稳定系统。数值例子用于说明我们算法的可行性及有效性。

Nov, 2020

使用基于物理信息的神经网络求解椭圆型最优控制问题

通过使用物理知识的神经网络方法，我们提供了一个数值求解器来解决线性和半线性二阶椭圆问题的最优控制问题，并进行了误差分析和性能比较。

Aug, 2023

用于非规则时间序列的神经控制微分方程

本研究介绍了一个新的神经模型：神经控制微分方程模型，解决了利用常规微分方程对时间动态进行建模时无法针对后续观察调整轨迹的问题，并通过实验和理论结果展示其在较多数据集上实现了与其他神经网络模型相当的最佳性能

May, 2020

神经常微分方程作为非线性最优控制的反馈策略

本文提出了基于神经常微分方程（Neural ODEs）的神经控制策略，将控制策略优化问题转化为一个 Neural ODE 问题，有效地利用动态系统模型，展示了这种确定性神经控制策略在两个受控系统中的功效：控制的 Van der Pol 系统和一个生物反应器控制问题。该方法为非线性控制问题的无法处理的闭环解提供了一种实用的逼近方法。

Oct, 2022

我们提出了一种新的理论方法，通过与泛化 Hopf 公式的建立来提高科学机器学习 (SciML) 过程的可解释性，并且该方法与最优控制问题和 Hamilton-Jacobi 偏微分方程 (HJ PDE) 的时间相关哈密顿量有关。同时，我们提供了一种基于 Riccati 的方法来解决学习问题，以应用于持续学习任务。

Nov, 2023

量子最优控制的高效量子算法

本论文提出了一种高效的量子算法，可用于解决量子最优控制问题，并附有详尽的误差分析，该方法基于时间依赖哈密顿模拟和梯度估算算法，并牵涉到了机器学习。但该算法需要容错量子计算机的支持。

Apr, 2023

一种用于连续非马尔可夫随机控制问题的神经 RDE 方法

提出一种基于神经粗糙微分方程的新框架，用于解决非马尔可夫随机控制问题，通过演示控制过程作为神经粗糙微分方程的解的模型来展示控制 - 状态联合动力学如何通过一个未受控的增量神经粗糙微分方程进行管理，同时通过演示神经粗糙微分方程是随机不平滑路径函数的通用近似器来提供理论支撑，实验结果显示，这种方法比现有的基于 RNN 的方法在不规则采样下具有更高的精度和稳定性。

Jun, 2023

稳定化递归平衡网络控制器的合成

基于循环平衡网络的非线性动态控制器参数化方法，通过投影策略梯度方法来合成控制器，并解决系统的快速稳定性与非线性问题。

Mar, 2022