BriefGPT.xyz
Sep, 2023
ResNet和Softmax的统一方案
A Unified Scheme of ResNet and Softmax
HTML
PDF
Zhao Song, Weixin Wang, Junze Yin
TL;DR
这篇论文通过理论分析提供了连接大语言模型、softmax回归、残差神经网络以及优化问题的统一方案,揭示出了损失函数的梯度、Hessian矩阵以及利普希茨特性,并通过该方案为未来深度学习模型的研究提供了新的洞察。
Abstract
large language models
(LLMs) have brought significant changes to human society.
softmax regression
and
residual neural networks
(ResNet) a
→