BriefGPT.xyz
Apr, 2024
神经元专业化:利用内在任务模块化实现多语言机器翻译
Neuron Specialization: Leveraging intrinsic task modularity for multilingual machine translation
HTML
PDF
Shaomu Tan, Di Wu, Christof Monz
TL;DR
通过神经元特化,提出一种解决多语言翻译中干扰和促进知识转移的方法,并通过大量实验证明了其相比强基准模型的性能提升以及减少干扰并增加知识转移的效果。
Abstract
Training a unified
multilingual model
promotes
knowledge transfer
but inevitably introduces negative
interference
.
→