ACLJun, 2023
跨语言转移的高效语言特定模型精简
Distilling Efficient Language-Specific Models for Cross-Lingual Transfer
Alan Ansell, Edoardo Maria Ponti, Anna Korhonen, Ivan Vulić
TL;DR提出从大规模多语言 Transformer 中提取压缩的、语言特定的模型的方法,通过二阶段稀疏精调生成双语模型,从而在目标语言性能方面表现出最小的降级而且速度更快。