Feb, 2024

神经网络中的最小深度

TL;DR神经网络的可表达性特征对于理解其在人工智能中的成功至关重要。本研究调查了关于 ReLU 神经网络表达能力以及与最小深度的猜想的两个主题,主题包括求和和最大运算的最小深度表示,以及多面体神经网络的探索。对于求和运算,我们确定了操作数的最小深度的充分条件来找到运算的最小深度。相反,关于最大运算,我们给出了一系列综合性的示例,证明了不依赖于操作数深度的充分条件不能暗示运算的最小深度。本研究还考察了凸连续分段线性函数之间的最小深度关系。在多面体神经网络方面,我们研究了几个基本性质,推导出与 ReLU 网络等效的结果,例如深度的包含关系和从顶点计算深度。值得注意的是,我们计算了单纯形的最小深度,这与 ReLU 网络中的最小深度猜想有着密切关联。