Oct, 2023

用于高效深度神经网络的可微分广义结构矩阵学习

TL;DR该论文研究了如何通过梯度下降学习结构化权重矩阵的一般化和可微分的框架,以取代常见神经网络模型中不透明的、层与层之间可能不同的密集矩阵,从而构建高性能且复杂度较低的高效深度神经网络。