Sep, 2022
稀疏训练通用框架的两个关键环节:层冻结和数据筛选
Layer Freezing & Data Sieving: Missing Pieces of a Generic Framework for Sparse Training
Geng Yuan, Yanyu Li, Sheng Li, Zhenglun Kong, Sergey Tulyakov...
TL;DR该论文提出了一种名为 SpFDE 的通用框架,通过采用稀疏训练、层冻结、数据筛选等技术,可以有效地降低训练成本并保持准确性。