ICLRNov, 2021

像素蝴蝶:稀疏训练神经网络模型的简单高效方法

TL;DR该研究提出了一种名为 Pixelated Butterfly 的稀疏模型训练方法,通过优化连续超集上的蝶式矩阵,采用简单的蝶式块和低秩矩阵稀疏化网络层,使训练速度提高 3 倍,并在 ImageNet 分类和 WikiText-103 语言建模任务中,使稀疏模型的训练速度比密集的 MLP-Mixer、Vision Transformer 和 GPT-2 medium 提高了 2.5 倍,而且精确度并未下降