Sep, 2023

ResNet和Softmax的统一方案

TL;DR这篇论文通过理论分析提供了连接大语言模型、softmax回归、残差神经网络以及优化问题的统一方案,揭示出了损失函数的梯度、Hessian矩阵以及利普希茨特性,并通过该方案为未来深度学习模型的研究提供了新的洞察。