BriefGPT.xyz
Ask
alpha
关键词
sub-word tokenizers
搜索结果 - 1
ACL
多语言语言建模中的分词影响:评估跨语言词汇分配和重叠
本文提出新的标准以评估子词符号化器中的词汇表示质量和词汇重叠度,并发现跨语言单词表的重叠实际上可能对某些下游任务(如 POS、依赖树标记)产生负面影响,而在命名实体识别和句子级任务(如跨语言检索、NLI)中分享词汇表是有益的。此外,本文还观
→
PDF
a year ago
Prev
Next