BriefGPT.xyz
Ask
alpha
关键词
domain-representative subsets
搜索结果 - 1
高效编码器预训练的自动文档选择
通过自动识别小但代表领域的子集,我们提出了一种替代更大的训练集的方法来预训练语言模型,拓展了一种基于统计的句子评分方法,以代表性目标领域语料库作为条件,例如,我们将 OntoNotes 语料库视为目标域并从 Pile cynically 选
→
PDF
2 years ago
Prev
Next