Oct, 2022

如何实现平衡高效的多语言模型: 既保护用户数据,又保持模型性能

TL;DR本文提出了一种基于教师-学生知识蒸馏的新型多语种训练技术,利用平衡(子采样)数据将单语教师模型的知识蒸馏到一个多语种学生中,可以提高自然语言处理系统中低资源语言的表现。