基于神经常微分方程的循环神经网络模型
提出一种新型深度神经网络模型 —— 连续深度模型,其采用了一个神经网络来参数化隐藏状态的导数,并利用黑箱微分方程求解器计算网络输出,使其具有内存成本不变、能够为每个输入自适应地选择评估策略并能显式进行精度 / 速度权衡等特点。研究者进一步证明了通过此模型可以构造出连续正则化流模型,能够通过最大似然进行训练,而不需要对数据维度进行分区或排序,并展示了如何在较大模型内部向任何 ODE 求解器进行可扩展地反向传播,从而实现 ODE 的端到端训练。
Jun, 2018
本文提出了一种基于神经 ODE 的 RNN 模型 (RNN-ODE-Adap),用于建模和预测非平稳时间序列数据,该模型可适应性地选择时间步长,并在 Hawkes 型时间序列数据中表现出一致性估计预测能力和计算成本优势。
Jun, 2023
本研究将学习规则和神经 ODE 相结合,构建了连续时间序列处理网络,学习如何在其他网络的快速变化的突触连接中操作短期记忆,这产生了快速权重程序员和线性变压器的连续时间对应物。该模型在各种时间序列分类任务中优于现有的神经控制微分方程模型,同时也解决了它们的根本可扩展性限制。
Jun, 2022
本文提出了一种名为 ODE-RNNs 的模型,可以对非匀齐时间间隔的时间序列进行建模,并通过实验表明,这种基于 ODE 的模型在处理不规则抽样数据时比基于 RNN 的模型表现更优。
Jul, 2019
本研究探讨使用神经常微分方程作为一种传播基于简化模型的潜在空间动力学的方法,并与两种传统的非侵入性方法进行比较,发现神经常微分方程提供了一个稳定和准确的演化潜在空间动力学的框架,但为了促进其广泛应用于大型系统,需要加速其训练时间。
Apr, 2021
本短文自给自足地介绍和调查了基于神经常微分方程(神经 ODE)的连续时间深度学习方法,主要面向熟悉普通微分方程和偏微分方程及其分析的读者,意在揭示它们在机器学习中的作用。通过使用机器学习和应用数学领域的三个示例,我们将看到神经 ODE 如何提供深度学习的新见解,并为更高效的算法打下基础。
Jan, 2024
介绍了一种新的数据驱动方法 ——Neural Jump ODE (NJ-ODE), 该模型模拟了连续时间下的随机过程。该模型使用神经 ODE 模型建模两个观察值之间的条件期望,并在每次发现新的观察值时进行跳跃。实验结果表明该模型对于更复杂的学习任务优于现有的基准模型。
Jun, 2020
本研究介绍了一个新的神经模型:神经控制微分方程模型,解决了利用常规微分方程对时间动态进行建模时无法针对后续观察调整轨迹的问题,并通过实验和理论结果展示其在较多数据集上实现了与其他神经网络模型相当的最佳性能
May, 2020
本研究旨在解决学习具有刚性系统的神经普通微分方程(ODE)的挑战,它通常来自化学和生物系统中的化学动力学建模。本文提出了使用深度网络、适当缩放网络输出以及稳定梯度计算等关键技术的方法,成功地演示了解决 Robertson 问题和空气污染问题中的硬化系统。通过使用学习刚性神经 ODE 的工具,可以在能源转换、环境工程以及生命科学等具有广泛时间尺度变化的应用中使用神经 ODE。
Mar, 2021
神经常微分方程(Neural ODEs)在深度学习文献中取得了巨大成功,最近提出了连续版本的 U-net 架构,在图像应用中显示出比离散版本更高的性能,并围绕其性能和鲁棒性提供了理论保证。本文探讨了使用神经 ODE 解决学习逆问题的可能性,尤其是在已知的学习 Primal Dual 算法中,并将其应用于 CT 重建。
May, 2024