Oct, 2022
触不得的易碎品:对比量化和蒸馏的稳定性以发展轻量低资源机器翻译模型
Too Brittle To Touch: Comparing the Stability of Quantization and
Distillation Towards Developing Lightweight Low-Resource MT Models
TL;DR本文研究了利用共享学习通过跨多语言模型实现低资源语种机器翻译的方法,探讨了知识蒸馏和后训练量化等压缩模型的技术,并发现后训练量化在所有语种中表现更加稳定。