Dec, 2022

Mini-Model Adaptation: 通过对齐的浅层训练有效地将预训练模型扩展到新语言

TL;DR提出了小型模型自适应方法 Mini-Model Adaptation,在参数的部分分数中构建浅层小型模型,以高效地训练新的语种嵌入,可应用于 Transformer 等预训练模型中,跨语言性能与标准方法相当,计算效率高达 2.4 倍。