AAAINov, 2018

在单词形态层面植入理性知识的分布式表示

TL;DR本文提出一种基于词构建立汉语词汇和语义本体,在词根级别上将结构化的理性知识嵌入到分布式表示中,避免了语料库中繁琐的消歧义。并通过实例扩增技术来利用层次信息和解决数据稀疏性问题,采用 word2vec 训练词素的分布式表示,并通过评估获得的嵌入,以词相似度度量为应用,与传统模型相比获得 5 个 Spearman 分数或 8 个百分点以上的显着改善,呈现出被采纳新知识来源的非常有前途的前景。