高速公路和残差网络学习展开式迭代估计

ICLRDec, 2016

高速公路和残差网络学习展开式迭代估计

Highway and Residual Networks learn Unrolled Iterative Estimation

Klaus Greff, Rupesh K. Srivastava, Jürgen Schmidhuber

TL;DR该论文探讨了高速公路网络和残差网络的新颖架构，并提出了基于展开迭代估计的另一种观点，该观点直接导致了高速公路和残差网络的构建。

Abstract

The past year saw the introduction of new architectures such as Highway networks and residual networks which, for the first time, enabled the training of feedforward networks with dozens to hundreds of layers usi

highway networks residual networks deep learning iterative estimation feedforward networks

发现论文，激发创造

高速公路网络

介绍了一种新的架构，名为高速公路网络，可以用梯度下降直接训练具有数百层的深度神经网络，并通过门控单元控制网络中的信息流动，从而易于解决深度神经网络训练的问题。

May, 2015

训练非常深的网络

本文介绍了一种名为 “HighWay Network” 的新型深度神经网络模型，采用门控单元对信息流进行监控，以实现高效的信息传递，从而克服了训练深度神经网络的问题。

Jul, 2015

可视化残差网络

本篇论文通过定性视觉和实证分析，研究残差网络中残差跳转连接的作用，揭示残差跳转连接强制不同层次的卷积层区分特征的实际意义，证明残差网络遵循卷积神经网络慢慢学习局部特征并学习整个物体全局特征的普适性。

Jan, 2017

带有指数线性单元的深度残差网络

本文旨在指出在深度卷积神经网络中引入跳过连接从而解决挥发的渐变问题的新方案，并提出将指数线性单元用于残差网络，以显著减小测试误差。

Apr, 2016

残差网络表现得像相对较浅的网络集合

本文提出了新颖的残差网络解释方式，将其看作是许多不同长度路径的集合，并且只需要在训练过程中利用短路径就可以实现很深的网络。通过病变研究，揭示了残差网络中路径呈现集合的行为，不是强依赖于彼此。

May, 2016

从动力系统观点设计的多层残差网络

本文提出使用动力学系统视角来分析残差网络损伤特性，基于这些分析引入一种新的方法来加速残差网络的训练，并将该方法应用于图像分类等多个任务。

Oct, 2017

深度残差 U-Net 实现的道路提取

本文提出了一种基于深度残差网络和 U-Net 的语义分割神经网络模型，可用于从航空图像中提取道路区域，并通过实验验证了该模型的优越性。

Nov, 2017

残差连接鼓励迭代推断

研究表明，Residual networks 可以通过迭代改进特征来执行表示学习和迭代细化，但对于这一过程的全面理解仍然是一个研究课题，并且共享残差层会导致表征爆炸和过拟合，需要采用现有的策略来缓解这个问题。

Oct, 2017

神经残差扩散模型用于深度可拓展视觉生成

使用神经残差扩散模型 (Neural Residual Diffusion Models) 框架，引入一系列可学习的门控残差参数来改善生成网络的可扩展性和生成内容的保真度与一致性。

Jun, 2024

再次让深度网络变得浅显

通过研究深度神经网络中的残差连接，提出了一种平行浅层架构的替代方案，通过在 Taylor 级数表达式中截断高阶项，发现广而浅的网络架构在性能上与传统的深层架构相当，这一发现有望简化网络架构、提高优化效率并加速训练过程。

Sep, 2023