Mar, 2024

一个镜面图书馆:低维深度神经网络是具有反射特征的凸Lasso模型

TL;DR通过证明,我们发现在一维数据上训练神经网络等效于求解一个带有固定、明确定义的特征字典矩阵的凸Lasso问题。具体的字典取决于激活函数和深度。我们研究了具有分段线性激活函数的两层网络,具有最多4层的深窄ReLU网络,以及具有符号激活和任意深度的矩形和树状网络。有趣的是,在ReLU网络中,第四层创建了代表训练数据关于它们自身的反射的特征。Lasso表示法为全局最优网络和解决方案空间提供了洞察。