BriefGPT.xyz
大模型
Ask
alpha
关键词
convergence inconsistency
搜索结果 - 1
EMNLP
多语言神经机器翻译中的收敛性统一化
本文介绍了一种名为 LSSD(Language-Specific Self-Distillation)的新型训练策略,该策略可以缓解不同语言对之间的收敛不一致性并帮助 MNMT 模型同时在每种语言对上取得最佳性能。实验结果表明,LSSD 可
→
PDF
2 years ago
Prev
Next