Oct, 2017

BPEmb:275 种语言中的无需分词的预训练子词嵌入

TL;DRBPEmb 是一个基于字节对编码(BPE)的资源高效、支持多种语言的预训练子词单元嵌入集合,经实验表现良好,特别是在实体类型上,有时优于替代的子词处理方法,可在不需要分词的情况下使用。