Oct, 2023

神经网络:深度、浅层,还是中间?

TL;DR我们对用具有宽度 W、深度 l 和 Lipschitz 激活函数的前馈神经网络的输出来逼近某个 Banach 空间中的紧致子集的误差给出了下界估计。我们证明,除了神经网络,只有当深度 l 趋于无穷大时,才有可能得到比熵数更好的速率,而如果我们固定深度并使宽度 W 趋于无穷大则无法获益。