Sep, 2021

关于循环神经网络的可证泛化性

TL;DR本文研究基于随机初始化的循环神经网络(RNN)的训练和泛化,提出了两个改进:1)无需归一化条件就能学习某些显著概念类的函数;2)能够学习输入序列的 N 元函数形式 f(β^T [X_{l_1},...,X_{l_N}]),该函数类别不属于可加分概念类,当其中某个 N 或者 l_0 较小时,f 能以接近于多项式级别的迭代次数和样本数进行学习。