Oct, 2022

触不得的易碎品:对比量化和蒸馏的稳定性以发展轻量低资源机器翻译模型

TL;DR本文研究了利用共享学习通过跨多语言模型实现低资源语种机器翻译的方法,探讨了知识蒸馏和后训练量化等压缩模型的技术,并发现后训练量化在所有语种中表现更加稳定。