Jun, 2024
WAVE: 变长模型自适应初始化的权重模板
WAVE: Weight Template for Adaptive Initialization of Variable-sized Models
Fu Feng, Yucheng Xie, Jing Wang, Xin Geng
TL;DR針對模型初始化問題,本文提出了一種名為 WAVE 的多任務初始化方法,該方法在目標模型初始化過程中使用可調節的權重模板來改善預訓練模型不相容問題,並通過知識蒸餾將預訓練模型的知識轉移到結構化知識中,從而實現更高效的模型初始化和知識傳遞。