BriefGPT.xyz
大模型
Ask
alpha
关键词
intra-distillation
搜索结果 - 2
ACL
具备语言意识的自监督学习多语言机器翻译
本文探讨了如何利用自监督学习的方法,在多语言机器翻译任务中实现参数的有利学习,其中采用了基于噪声消除的简单自监督任务,并将其与原有任务同时进行。通过这两种方法的结合,在 8 种和 15 种语言基准测试中分别比 MASS 等三种最先进的自监督
→
PDF
a year ago
EMNLP
参数的重要性:一种用于提高性能的内部蒸馏方法
本文提出了一种基于 intra-distillation 和自适应学习的通用方法,用于平衡所有参数的灵敏度,从而提高模型的普适性和性能表现。实验结果表明,该方法有效地提升了机器翻译、自然语言理解和零 - shot 跨语言转移等不同领域的表现
→
PDF
2 years ago
Prev
Next