May, 2024

神经网络的热带表达能力

TL;DR我们提出了一种代数几何框架来研究线性激活神经网络的表达能力。我们在热带几何的环境中工作,利用热带有理映射和前馈神经网络之间的已知连接,构建了一个丰富的研究神经网络的热带几何理论。我们的工作在选择采样域、对具有对称性的网络架构进行引导性采样域限制以及分析神经网络作为热带 Puiseux 有理映射方面做出了贡献。通过一系列概念证明的数值实验,我们展示了热带几何理论可以应用于揭示网络的表达特性的广泛神经网络架构。我们的工作为从计算热带几何和符号计算领域的理论和现有软件转化到深度学习提供了基础。