AAAIMar, 2016

无监督的词语相似度测量方法:如何在向量空间模型中超越共现和向量余弦

TL;DR本文认为矢量余弦在向量空间模型中用于识别单词相似度的无监督度量之一,可以被计算目标词最互相关联上下文的交集的无监督度量领先。为了证明这一点,我们描述并评估了 APSyn,它是平均精度的一种变体,无需任何优化,在标准 ESL 测试集上比矢量余弦和共现提高了 9.00%至 17.98%,具体取决于选择的顶部上下文的数量。