May, 2019
不受拼写错误影响的词嵌入
Misspelling Oblivious Word Embeddings
Bora Edizel, Aleksandra Piktus, Piotr Bojanowski, Rui Ferreira, Edouard Grave...
TL;DR本文提出了一种基于 FastText 和子词(subwords)的方法,通过监督学习拟合拼写错误,使得单词的嵌入向量更加适用于包含大量未登录词的文本,并在公开测试数据集上对内在和外在的 NLP 任务进行了实验验证。