Sep, 2018

使用子词袋来泛化字嵌入

TL;DR本文提出了一种基于子词级别的词向量生成模型来解决传统词向量模型无法应对未登录词、破音字等问题,并在英文词汇相似性任务和23种语言的词性标注和变形属性的联合预测任务中实现了最优表现。