Sep, 2023

深度学习网络的几何结构和全局L^2最小化器的构建

TL;DR用几何方法解释了Deep Learning(DL)网络的结构,包括L个隐藏层、坡度激活函数、L2 Schatten类(或Hilbert-Schmidt)成本函数以及相等维度的输入输出空间R^Q。隐藏层在空间R^Q上定义,并且用于通过递归应用截断映射来筛选训练输入。此外,找到了成本函数的2^Q-1个不同退化局部最小值。