出人意料：相似度评分的对比效应

Aug, 2023

出人意料：相似度评分的对比效应

Taken by Surprise: Contrast effect for Similarity Scores

homas C. Bachlechner, Mario Martone, Marjorie Schillo

TL;DR通过提出 “惊喜得分”，一种集合标准化相似性度量方法，提高零样本和少样本文档分类任务的性能，相比原始余弦相似性，通常可以达到 10-15％的更好性能。

Abstract

Accurately evaluating the similarity of object vector embeddings is of critical importance for natural language processing, information retrieval and classification tasks. Popular →

发现论文，激发创造

SAME 分数：基于余弦的词向量偏差分数的改进

本文研究了利用余弦相似度对词嵌入进行编码的偏见评分，提出了一种新的偏见评分方法 SAME，并用实验证明其比现有的评分方法更能准确评估词嵌入中的偏见。

Mar, 2022

基于排名的词向量相似度度量

本文研究了基于词嵌入的语义相似度计算方法，提出了一种基于排名的度量方法，在相似度测量和异常值检测方面表现良好，表明基于排名的度量方法可以提高聚类质量。

May, 2018

嵌入向量的余弦相似度真的只是相似性吗？

用于量化高维对象之间语义相似度的余弦相似度在实践中比未归一化的嵌入向量点积表现有时更好、有时更差。通过研究基于正则化线性模型的嵌入，我们得出了余弦相似度可以产生任意且无意义的相似度的结论。因此，我们提醒不要盲目使用余弦相似度，并提出替代方法。

Mar, 2024

上下文比对：使用度量张量提高余弦相似度测量

本文中，我们提出了使用扩展余弦相似度测量来提高单词相似度任务的性能，我们还探索了这种方法在上下文相同的情况下特别有效的假设，并使用了不同的数据集来进行测试。测试结果显示，使用本文提出的方法可以显著提高相似度任务的性能。

Mar, 2022

基于余弦的词向量偏倚分数的语义属性

在这项工作中，我们通过基于几何定义的偏见，提出了对偏见得分的要求，以便被认为是衡量偏见的有意义的方法，并通过对文献中的余弦偏见得分进行形式分析，加以强调，并通过实验证明偏见得分的局限性对应用案例产生影响。

Jan, 2024

用对比语料库归属解释表示

提出了一种基于对比语料相似性的无监督模型解释方法，能够产生更具有语义意义的标量解释输出，应用于图像数据增强与零样本物体定位领域。

Sep, 2022

相关系数与语义文本相似度

本研究比较了常见文本向量表示方法中余弦相似度和皮尔逊相关系数等相似度计算方法的优缺点及其适用范围，并提出使用非参数秩相关系数作为相似度计算方法，以提高语义文本相似性任务的性能表现。

May, 2019

对于高频词嵌入相似度度量中余弦相似度的问题

使用余弦相似度可对于 NLP 的任务（如问答，信息检索，机器翻译）进行上下文嵌入建模，但是我们发现使用 BERT 解析的余弦相似度在估算词语相似度方面存在高低频词的差异，在控制多义性和其他因素后，高频词与同一词语的其他实例或其他上下文中的其他词语的相似度被低估，这种低估是由于高低频词的代表性几何形状差异导致.

May, 2022

神经网络单词嵌入的不确定性：相似度阈值探索

本论文探讨了单词嵌入模型中相似度得分的实际指示性和有用性，通过引入阈值过滤高度相关的单词，实验证明该方法在信息检索方面具有显著优势。

Jun, 2016

CorrEmbed: 评估预训练模型图像相似性效果的新指标

利用预训练的计算机视觉模型提取高级图像特征的图像嵌入相似性在识别具有相似组成的图像方面表现出显著的效果。本文提出了一种名为 CorrEmbed 的新方法，通过计算图像嵌入和人工生成的标签向量之间的距离相关性来评估来自多个预训练的计算机视觉模型的图像嵌入的可行性。我们使用这个指标广泛评估了多种预训练的 Torchvision 模型，揭示了 ImageNet1k 准确率分数和标签相关性分数之间的线性关系。值得注意的是，我们的方法还可以识别出与这一模式偏离的情况，从而揭示了不同模型如何捕捉高级图像特征。CorrEmbed 为研究人员和实践者在时尚零售中开发有效的基于数据驱动的相似物品推荐方法提供了一个强大的性能评估工具。

Aug, 2023