BriefGPT.xyz
大模型
Ask
alpha
关键词
composition bias
搜索结果 - 1
神经机器翻译的规模定律
通过本文所提及的实证研究,我们揭示了神经机器翻译中,编码器 - 解码器 Transformer 模型的扩展特性。具体而言,本文提出了一个公式来描述交叉熵损失与编解码器大小的扩大倍数之间的关系,并在多种扩展方法及语言下展现了估计的准确性。我们
→
PDF
3 years ago
Prev
Next