- 理解具有条件最优输运的无限深度和宽度的 ResNet 的训练
该研究探讨深度神经网络训练中的梯度流收敛问题,并提出了一种基于条件最优传输距离的训练模型,通过梯度流方程的良定性和多项式 - Lojasiewicz 分析证明了在适当的初始化条件下,梯度流可以收敛于全局极小值。
- 基于残差网络的岩石分类
岩石分类是一个重要的地质问题,本研究基于残差神经网络提出了两种方法,包括数据增强和多头自注意力,以实现更好的岩石分类准确率。
- 用残差学习从白质扩散度预测年龄
利用微结构特征和非宏观结构特征,开发基于白质特定的年龄估计方法,成功捕捉异常的白质年龄化现象。
- ResNet 和 Softmax 的统一方案
这篇论文通过理论分析提供了连接大语言模型、softmax 回归、残差神经网络以及优化问题的统一方案,揭示出了损失函数的梯度、Hessian 矩阵以及利普希茨特性,并通过该方案为未来深度学习模型的研究提供了新的洞察。
- 深度神经网络的插值、逼近和可控性
我们通过控制理论研究将深层残差神经网络作为连续动力系统的表达能力。具体而言,我们考虑从监督学习中产生的两个特性,即通用插值 - 能够匹配任意输入和目标训练样本,以及紧密相关的通用逼近 - 能够通过流映射逼近输入 - 目标函数关系。在控制结构 - 深度残差网络对神经常微分方程的隐式正则化
深度残差网络与神经常微分方程之间的离散化联系被建立,证明了在特定条件下网络收敛至全局最小值。
- 优化心电图分类的神经网络规模
研究使用卷积神经网络 (CNN) 分析心电图 (ECG) 的缩放方法,重点研究了残差神经网络 (ResNet)。通过调整网络的关键参数,如层的深度、通道的数量和卷积核大小,发现较浅的网络、更多的通道和较小的卷积核尺寸对于 ECG 分类等任务 - 从 NeurODEs 到 AutoencODEs:针对宽度可变的神经网络的均场控制框架
本文介绍了 AutoencODE 方法,它是一个连续时间的自编码器,通过将 NeurODEs 与均值场控制框架相结合,处理了低 Tikhonov 正则化的情况,得到了在局部凸损失函数的区域中可以恢复全局结果的结论。此外,本文提出了一种适用于 - 最优时间变量学习中的时间规则化
本文在深度神经网络中引入最优时间变量学习,并通过引入与离散动态系统的时间跨度直接相关的正则化项,进一步拓展了该概念。此外,我们还提出了一种自适应修剪方法,适用于具有残差的神经网络 (ResNet),在不影响表达能力的同时,降低网络复杂度和训 - 理解图像增强的好处
本文研究了在神经网络中使用图像增强技术的效果对 ResNet 网络中不同层的影响和应用,发现使用两幅图像的增强技术显著影响网络学习,而对于采用 Imagenet-1K 权重和 fine-tuning 的深层 ResNets,各层受到的影响程 - 深度 ResNet 的过度参数化:零损失和平均场分析
研究无限深度和无限宽度下 Residual 神经网络中梯度下降和凸优化的等效性,得出当神经网络足够大时,ResNet 的训练可以得到几乎没有误差的近似解决方案。
- ICML残差网络中的身份连接提高噪声稳定性
本研究比较 ResNets 和 PlnNets 的训练效率、泛化能力、容错率等性能,并探讨了两者之间简化版本的等价性,进而猜测 ResNets 泛化能力更强的原因与其较高的噪音容错能力有关,并通过实验支持了该猜想。
- 深度残差神经网络的分层并行训练
该论文提出了一种基于多格迭代和并行计算的新型深度神经网络训练算法,和传统的序列前向、后向传播不同,该方法使神经网络的训练过程具备了层间的并行性,并取得了与传统方法相当的训练性能。
- 残差网络通过通用的激活函数实现动态等比特性
本文研究了残差神经网络中动态同构的可达性,借助自由概率和随机矩阵理论,我们导出了初始化时输入输出雅可比矩阵谱密度的通用公式,在大型网络中我们得到了一个依赖于单个参数的奇异值谱,并分析了各种常见激活函数的信号传播,我们通过随机矩阵和 CIFA