出人意料:相似度评分的对比效应
本文研究了利用余弦相似度对词嵌入进行编码的偏见评分,提出了一种新的偏见评分方法 SAME,并用实验证明其比现有的评分方法更能准确评估词嵌入中的偏见。
Mar, 2022
用于量化高维对象之间语义相似度的余弦相似度在实践中比未归一化的嵌入向量点积表现有时更好、有时更差。通过研究基于正则化线性模型的嵌入,我们得出了余弦相似度可以产生任意且无意义的相似度的结论。因此,我们提醒不要盲目使用余弦相似度,并提出替代方法。
Mar, 2024
本文中,我们提出了使用扩展余弦相似度测量来提高单词相似度任务的性能,我们还探索了这种方法在上下文相同的情况下特别有效的假设,并使用了不同的数据集来进行测试。测试结果显示,使用本文提出的方法可以显著提高相似度任务的性能。
Mar, 2022
在这项工作中,我们通过基于几何定义的偏见,提出了对偏见得分的要求,以便被认为是衡量偏见的有意义的方法,并通过对文献中的余弦偏见得分进行形式分析,加以强调,并通过实验证明偏见得分的局限性对应用案例产生影响。
Jan, 2024
本研究比较了常见文本向量表示方法中余弦相似度和皮尔逊相关系数等相似度计算方法的优缺点及其适用范围,并提出使用非参数秩相关系数作为相似度计算方法,以提高语义文本相似性任务的性能表现。
May, 2019
使用余弦相似度可对于 NLP 的任务(如问答,信息检索,机器翻译)进行上下文嵌入建模,但是我们发现使用 BERT 解析的余弦相似度在估算词语相似度方面存在高低频词的差异,在控制多义性和其他因素后,高频词与同一词语的其他实例或其他上下文中的其他词语的相似度被低估,这种低估是由于高低频词的代表性几何形状差异导致.
May, 2022
利用预训练的计算机视觉模型提取高级图像特征的图像嵌入相似性在识别具有相似组成的图像方面表现出显著的效果。本文提出了一种名为 CorrEmbed 的新方法,通过计算图像嵌入和人工生成的标签向量之间的距离相关性来评估来自多个预训练的计算机视觉模型的图像嵌入的可行性。我们使用这个指标广泛评估了多种预训练的 Torchvision 模型,揭示了 ImageNet1k 准确率分数和标签相关性分数之间的线性关系。值得注意的是,我们的方法还可以识别出与这一模式偏离的情况,从而揭示了不同模型如何捕捉高级图像特征。CorrEmbed 为研究人员和实践者在时尚零售中开发有效的基于数据驱动的相似物品推荐方法提供了一个强大的性能评估工具。
Aug, 2023