Feb, 2024

神经网络内部对称统一化: Transformer, Feedforward 和 Neural ODE

TL;DR通过将物理学中的规范对称性原理应用于神经网络结构,本研究发现各种机器学习模型的参数冗余可以解释为规范对称性,进而揭示了深度学习模型的复杂行为,并为分析各类机器学习结构提供了一个统一的视角。