BriefGPT.xyz
Ask
alpha
关键词
distill multiple steps
搜索结果 - 1
DiMS: 迭代非自回归变换器的多步精简
本文提出了一种叫做 Distill Multiple Steps 的简单而有效的蒸馏技术,它可以通过使用学生模型和教师模型,使得输出的质量得到提高,且能够减少到达特定翻译质量所需的步骤数。
PDF
2 years ago
Prev
Next