BriefGPT.xyz
Ask
alpha
关键词
initialization scales
搜索结果 - 1
ICML
优化计算效率:用结构矩阵代替稠密层
稠密线性层、结构化矩阵、初始化尺度、学习速率和计算高效模型是这篇论文的关键。
PDF
a month ago
Prev
Next