Apr, 2020

多语言序列标注的结构级知识蒸馏

TL;DR该研究提出使用知识蒸馏减少多语言模型与单语言模型之间性能差距,实验结果显示我们的方法优于多个基准模型并具有更强的零次通用性。