一种用于连续非马尔可夫随机控制问题的神经 RDE 方法

ICMLJun, 2023

一种用于连续非马尔可夫随机控制问题的神经 RDE 方法

A Neural RDE approach for continuous-time non-Markovian stochastic control problems

Melker Hoglund, Emilio Ferrucci, Camilo Hernandez, Aitor Muguruza Gonzalez, Cristopher Salvi...

TL;DR提出一种基于神经粗糙微分方程的新框架，用于解决非马尔可夫随机控制问题，通过演示控制过程作为神经粗糙微分方程的解的模型来展示控制 - 状态联合动力学如何通过一个未受控的增量神经粗糙微分方程进行管理，同时通过演示神经粗糙微分方程是随机不平滑路径函数的通用近似器来提供理论支撑，实验结果显示，这种方法比现有的基于 RNN 的方法在不规则采样下具有更高的精度和稳定性。

Abstract

We propose a novel framework for solving continuous-time non-Markovian stochastic control problems by means of neural rough differential equations (Neural RDEs) introduced in Morrill et al. (2021). →

stochastic control neural rough differential equations non-markovianity monte-carlo estimation rnn

发现论文，激发创造

用神经粗糙微分方程处理长时间序列

本文介绍了一种基于粗路径理论的新方法，使用 log-signature 表示输入信号，扩展了神经控制微分方程 (CDE) 的应用。这种扩展方法可以处理长度为 17k 的时间序列问题，并比现有方法具有更快的训练速度、更好的模型性能和更少的内存需求。

Sep, 2020

神经控制微分方程用于在线预测任务

本文提出神经控制微分方程 (Neural CDE) 用于解释不规则时间序列的函数，同时研究了在连续监测过程中，如何解决实时在线预测的问题，本文提出的插值方案具有测量性和平滑性，并在 MIMIC-IV 医疗数据库上进行了实证测试，对于三个连续监测任务的准确性均有提升。

Jun, 2021

基于神经 RDE 模型求解路径相关偏微分方程

本文提出了一种基于神经粗糙微分方程（NRDE）模型来学习路径相关部分微分方程（PPDE），该模型通过对数签名特征有效地编码路径信息并捕捉基本动态，在 PPDE 解的连续时间模型中提供了内存使用效率和处理维度扩展性的优点，并通过多个数值实验验证了其性能优越性。

Jun, 2023

神经常微分方程作为非线性最优控制的反馈策略

本文提出了基于神经常微分方程（Neural ODEs）的神经控制策略，将控制策略优化问题转化为一个 Neural ODE 问题，有效地利用动态系统模型，展示了这种确定性神经控制策略在两个受控系统中的功效：控制的 Van der Pol 系统和一个生物反应器控制问题。该方法为非线性控制问题的无法处理的闭环解提供了一种实用的逼近方法。

Oct, 2022

如何从三分钟数据中学习和泛化：物理约束和不确定性感知的神经随机微分方程

本文提出了一种使用神经随机微分方程学习控制动力学模型的框架和算法，能够构建模型预测控制算法以及模型基的增强学习领域中的仿真器，在模拟机器人系统中得到良好的应用。

Jun, 2023

用于非规则时间序列的神经控制微分方程

本研究介绍了一个新的神经模型：神经控制微分方程模型，解决了利用常规微分方程对时间动态进行建模时无法针对后续观察调整轨迹的问题，并通过实验和理论结果展示其在较多数据集上实现了与其他神经网络模型相当的最佳性能

May, 2020

神经控制微分方程中的可学习路径

本文研究神经控制微分方程的连续解法，采用编码 - 解码模块，通过插值算法生成连续路径，达到更好的时间序列分类和预测表现。

Jan, 2023

使用神经常微分方程的基于模型的半马尔科夫决策过程强化学习

本论文介绍了两种用于半 Markov 决策过程的新型模型强化学习框架中，用神经常微分方程建模连续时间动力学的优雅解决方案。我们的模型准确地表征了连续时间动态，使我们能够使用少量数据开发出高效的策略。同时，我们还开发了一种基于模型的方法用于优化时间表，以减少与环境的交互频率，同时保持近乎最优的性能。我们通过各种连续时间领域的实验，证明了我们方法的有效性。

Jun, 2020

使用前向 - 后向 SDE 学习深度随机最优控制策略

本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究，旨在解决机器人和自主决策问题中的不确定性，并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中，我们研究了所提算法的性能和可扩展性，并讨论了未来的研究方向及其对机器人技术的影响。

Feb, 2019

神经状态相关时滞微分方程

本论文在神经延迟微分方程（Neural DDE）的基础上，提出了一种新的神经状态依赖延迟微分方程（SDDDE）的框架，该方法能更好地适用于包含多个状态依赖延迟的复杂系统，并在多种延迟动态系统的数据上显示了较高的性能。

Jun, 2023