BriefGPT.xyz
Ask
alpha
关键词
wordpiece
搜索结果 - 2
COLING
MaxMatch-Dropout: WordPiece 的子词规范化
本文提出了一种用于 WordPiece 的子词规则化方法,使用最大匹配算法进行分词,并通过 MaxMatch-Dropout 方法实现对 BERT-base 等预训练语言模型的微调,实验证明该方法在文本分类和机器翻译任务以及其他子词规则化方
→
PDF
2 years ago
EMNLP
快速 WordPiece 分词
本文提出 WordPiece 的高效算法以及针对单词和一般文本的标记化方法,包括将预标记文本和线性时间算法相结合,此方法相对于现有方法可提高 8.2 倍到 5.1 倍的效率。
PDF
4 years ago
Prev
Next