ICMLJun, 2024

优化计算效率:用结构矩阵代替稠密层

TL;DR稠密线性层、结构化矩阵、初始化尺度、学习速率和计算高效模型是这篇论文的关键。