ICMLJun, 2023

一种用于连续非马尔可夫随机控制问题的神经 RDE 方法

TL;DR提出一种基于神经粗糙微分方程的新框架,用于解决非马尔可夫随机控制问题,通过演示控制过程作为神经粗糙微分方程的解的模型来展示控制 - 状态联合动力学如何通过一个未受控的增量神经粗糙微分方程进行管理,同时通过演示神经粗糙微分方程是随机不平滑路径函数的通用近似器来提供理论支撑,实验结果显示,这种方法比现有的基于 RNN 的方法在不规则采样下具有更高的精度和稳定性。