基于余弦的词向量偏倚分数的语义属性
本文研究了利用余弦相似度对词嵌入进行编码的偏见评分,提出了一种新的偏见评分方法 SAME,并用实验证明其比现有的评分方法更能准确评估词嵌入中的偏见。
Mar, 2022
本研究基于模板方法提出了一种量化 BERT 中偏见的方法,并且通过性别代词解析的案例研究证明了该方法在捕捉社会偏见方面的优越性,同时也指出了该方法的普遍适用性,包括在多类别设置中使用的种族和宗教偏见。
Jun, 2019
本文中,我们提出了使用扩展余弦相似度测量来提高单词相似度任务的性能,我们还探索了这种方法在上下文相同的情况下特别有效的假设,并使用了不同的数据集来进行测试。测试结果显示,使用本文提出的方法可以显著提高相似度任务的性能。
Mar, 2022
该研究对分布式词向量空间中的偏见效应进行了系统性分析,研究表明:偏见效应在不同的词向量模型、文本类型和语言之间是不一致的,同时,双语词向量空间中的跨语言偏见也是存在的。该研究以期促进自然语言处理中的偏见研究,为偏见缓解技术的发展提供帮助。
Apr, 2019
本研究比较了常见文本向量表示方法中余弦相似度和皮尔逊相关系数等相似度计算方法的优缺点及其适用范围,并提出使用非参数秩相关系数作为相似度计算方法,以提高语义文本相似性任务的性能表现。
May, 2019
使用余弦相似度可对于 NLP 的任务(如问答,信息检索,机器翻译)进行上下文嵌入建模,但是我们发现使用 BERT 解析的余弦相似度在估算词语相似度方面存在高低频词的差异,在控制多义性和其他因素后,高频词与同一词语的其他实例或其他上下文中的其他词语的相似度被低估,这种低估是由于高低频词的代表性几何形状差异导致.
May, 2022
本研究评估了三种类型的词嵌入性别偏见度量的可信度,包括测试再测试可靠性、评分者一致性和内部一致性,并考察了不同随机种子、评分规则和单词选择等因素对可信度的影响,结果有助于更好地设计性别偏差度量,同时也建议研究者对这些度量的应用更加持批判态度。
Sep, 2021
本文介绍了一个基于 Wikipedia 文章的可解释模型来评分网络文档的偏见性,并且应用该模型研究了 Wikipedia 文章中的偏见的时间演变,新闻媒体的偏见比较和法律修正案中的偏见评分,最后发现在各个领域中,法规文件是最少有偏见的,新闻媒体是最有偏见的,Wikipedia 文章则居中。
Jul, 2023
本研究提出了一种采用平滑一阶共现关系来度量文本中偏见的方法,通过与向量相似性进行对比实验,对经常使用的词向量方法在量化偏见时引入非相关概念的问题进行探究,并在英文维基百科语料库上测量了职业词的性别偏见,得到了与美国职场实际情况更高相关性的结果。
Dec, 2018