Jun, 2024

自蒸馏模型叠加在200+种语言中实现跨语言自然语言理解

TL;DR通过将MT编码器直接集成到LLM主干中,我们通过样本高效的自我蒸馏获得了MT-LLM,从而将低资源语言与以英语为中心的LLM中嵌入的丰富知识相结合,实现了跨语言的多语言语言理解。