KDDMay, 2019

通过潜在语义插补增强领域词嵌入

TL;DR本研究提出了一种名为潜在语义填补(LSI)的方法,利用图论提取亲和性空间内实体的潜在流形结构,结合非负最小二乘法和幂迭代法,将外部知识转移入语义空间,生成并填补语义空间中低频词的可靠嵌入向量,优化词嵌入效果,进而提升下游自然语言处理任务的性能。实验验证了该方法在分类和语言模型任务中的显著优于多种常用词嵌入方法,且结果在不同参数下稳定一致。