Mar, 2024

嵌入向量的余弦相似度真的只是相似性吗?

TL;DR用于量化高维对象之间语义相似度的余弦相似度在实践中比未归一化的嵌入向量点积表现有时更好、有时更差。通过研究基于正则化线性模型的嵌入,我们得出了余弦相似度可以产生任意且无意义的相似度的结论。因此,我们提醒不要盲目使用余弦相似度,并提出替代方法。