Aug, 2023

深层运算网络的尺寸下界

TL;DR深度操作网络是解决无限维度回归问题和解决一类偏微分方程的一种越来越受欢迎的范式。本文旨在建立一种首次依赖数据的,能够减少噪声数据上经验误差的 DeepONets 所需的下界大小。具体来说,我们表明为了在 n 个数据点上获得较低的训练误差,分支网络和主干网络的共同输出维度需要按照 Ω (√n) 的比例缩放。这激发了我们使用 DeepONets 解决对流 - 扩散 - 反应 PDE 的实验,我们展示了在固定模型大小的情况下,利用这个共同输出维度的增加可以获得训练误差的单调降低,但训练数据的大小可能需要与其呈平方比例关系。