Apr, 2024

深度神经网络的奇异黎曼几何方法 III. 分段可微层与 $n$ 维类的随机漫步

TL;DR神经网络在生活中起着至关重要的作用,最现代的生成模型能够取得令人印象深刻的结果。本文将几何框架应用于研究神经网络,探讨卷积、残差和递归神经网络,以及非可微激活函数的情况,并通过图像分类和热力学问题的数值实验来说明研究结果。