BriefGPT.xyz
大模型
Ask
alpha
关键词
mlm
搜索结果 - 1
EMNLP
遮蔽语言建模和分布假设:有序词预训练对小型模型的影响
本文提出了一个新的解释:遮蔽语言模型 (MLM) 成功地解决了下游任务几乎完全归功于其建模更高阶词共现统计量的能力。
PDF
3 years ago
Prev
Next