Jul, 2023

一种公理化的深度神经网络 PDE 模型

TL;DR深度神经网络与偏微分方程之间的关系启发我们研究了深度神经网络的偏微分方程模型的一般形式。在一些合理的假设下,我们证明演化算子实际上由对流 - 扩散方程决定。这个模型为几个有效的网络提供了数学解释。此外,我们还展示了对流 - 扩散模型提高了鲁棒性并减小了 Rademacher 复杂度。基于对流 - 扩散方程,我们设计了一种适用于 ResNets 的新训练方法。实验证实了所提出方法的性能。