Apr, 2023

利用知识蒸馏压缩多语言神经机器翻译模型的实证研究

TL;DR本文探讨了如何通过知识蒸馏来压缩 MNMT 模型,发现这是一项具有挑战性的任务,并提出了一些设计思考和优化方案。