ICLRNov, 2021
像素蝴蝶:稀疏训练神经网络模型的简单高效方法
Pixelated Butterfly: Simple and Efficient Sparse training for Neural Network Models
Tri Dao, Beidi Chen, Kaizhao Liang, Jiaming Yang, Zhao Song...
TL;DR该研究提出了一种名为 Pixelated Butterfly 的稀疏模型训练方法,通过优化连续超集上的蝶式矩阵,采用简单的蝶式块和低秩矩阵稀疏化网络层,使训练速度提高 3 倍,并在 ImageNet 分类和 WikiText-103 语言建模任务中,使稀疏模型的训练速度比密集的 MLP-Mixer、Vision Transformer 和 GPT-2 medium 提高了 2.5 倍,而且精确度并未下降