Oct, 2020

利用单词嵌入解释隐喻

TL;DR使用基于语料库的单词嵌入模型,处理词汇隐喻并生成一个有序候选诠释列表。该模型通过从依存解析语料库中自动提取主题(如 “时间”)和载体(如 “金钱”)组件的搭配来获取候选的含义,并通过语义向量空间来衡量候选诠释与隐喻组件之间的相似度。最后,聚类算法去除了语义相关的重复诠释,从而使其他候选诠释具有更高的排名。在不同的语义标注数据集上进行评估,取得了令人鼓舞的初步结果。