Jun, 2024

自蒸馏模型叠加在 200 + 种语言中实现跨语言自然语言理解

TL;DR通过将 MT 编码器直接集成到 LLM 主干中,我们通过样本高效的自我蒸馏获得了 MT-LLM,从而将低资源语言与以英语为中心的 LLM 中嵌入的丰富知识相结合,实现了跨语言的多语言语言理解。