随机梯度下降能否学习具有可证明泛化性的循环神经网络？

Feb, 2019

随机梯度下降能否学习具有可证明泛化性的循环神经网络？

Can SGD Learn Recurrent Neural Networks with Provable Generalization?

Zeyuan Allen-Zhu, Yuanzhi Li

TL;DR本文研究了 RNN 模型在 PAC 学习语言中所能学习的概念类别以及如何通过渐进多项式时间和样本复杂度来有效地学习一些显著的概念类别，例如使用平滑的双层神经网络从不同的输入信息生成各自的输出信息。

Abstract

recurrent neural networks (RNNs) are among the most popular models in sequential data analysis. Yet, in the foundational pac learning lang

recurrent neural networks sequential data analysis pac learning stochastic gradient descent concept class

发现论文，激发创造

关于循环神经网络的可证泛化性

本文研究基于随机初始化的循环神经网络（RNN）的训练和泛化，提出了两个改进：1）无需归一化条件就能学习某些显著概念类的函数；2）能够学习输入序列的 N 元函数形式 f（β^T [X_{l_1},...,X_{l_N}]），该函数类别不属于可加分概念类，当其中某个 N 或者 l_0 较小时，f 能以接近于多项式级别的迭代次数和样本数进行学习。

Sep, 2021

关于训练循环神经网络的收敛速率

本文研究了如何在训练多层神经网络时，通过采用类局部搜索方法（如随机梯度下降）避免陷入不良局部最小值，在给定非凸非光滑结构的情况下，它们如何适应随机标签；研究了在神经网络中如何使用 ReLU 激活函数避免指数梯度爆炸或消失；通过构建扰动理论，该理论可用于分析 ReLU 激活的多层网络的一阶数学逼近。

Oct, 2018

循环神经网络中学习更长记忆

本文介绍了一种用于解决长期依赖的神经网络结构 —— 循环神经网络，并通过对语言建模等实验得出其同 LSTM 网络有着类似的性能表现。

Dec, 2014

一类循环神经网络的泛化界限

研究对循环神经网络的推广能力，通过探究四种变体，包括最小门单元、长短期记忆和卷积循环神经网络，建立了 PAC-Learning 框架下的推广界限，并在额外的规范假设下建立了更加精细的推广界限，与现有结果相比，说明了这些变体在推广中的优势。

Oct, 2019

循环神经网络的最近进展

本文对循环神经网络的基本原理、最新进展和研究挑战进行了说明，介绍了针对学习长期依赖问题的新进展，适合该领域的新手和专业人士。