May, 2019

不受拼写错误影响的词嵌入

TL;DR本文提出了一种基于 FastText 和子词(subwords)的方法,通过监督学习拟合拼写错误,使得单词的嵌入向量更加适用于包含大量未登录词的文本,并在公开测试数据集上对内在和外在的 NLP 任务进行了实验验证。