美国法律意见书中种族偏见趋势

Jul, 2023

Racial Bias Trends in the Text of US Legal Opinions

Rohan Jinturkar

TL;DR通过分析 1860 年到 2009 年超过 600 万份美国联邦和州法院案件的 GloVe 单词嵌入，研究发现几乎所有地区和时期都存在种族偏见现象，即传统黑人姓名更与 “不愉快” 术语相关，而传统白人姓名则更与 “愉悦” 术语相关，这些结果促进了对种族偏见的进一步研究。

Abstract

Although there is widespread recognition of racial bias in US law, it is unclear how such bias appears in the language of law, namely judicial opinions, and whether it varies across →

racial bias judicial opinions glove word embeddings time period institutionalized racial bias

发现论文，激发创造

法律意见词嵌入的性别和种族刻板印象检测

本文针对自然语言处理中的语言偏见问题，提出了一种用于识别美国司法审判文件中的嵌入有性别和种族刻板印象的词语的方法，并对法律域中的这些性别和种族偏见问题进行了分析并提出了可能的缓解策略。

Mar, 2022

质疑案件判决摘要中的偏见：法律数据集还是大型语言模型？

通过研究法律数据集和大型语言模型产生的案件判决摘要中存在的偏见，分析其对法律决策的影响，揭示大型语言模型和预训练的摘要模型生成结果中存在的有趣偏见，并探讨这些偏见背后的原因。

Dec, 2023

法庭裁决中的性别偏见检测：巴西案例研究

该研究提出了一个实验框架，用于自动检测巴西葡萄牙语法院判决中的性别偏见，并描述了这项技术的关键特征，以支持研究和评估法院活动。

Jun, 2024

数据和机器学习算法中种族偏见对用户说服力和歧视性决策的因果影响：实证研究

AI/NLP models trained on racially biased datasets demonstrate various types of bias, raising profound ethical implications regarding the impact of these models on user experience and decision-making due to the presence of racial bias features in datasets. The research implicates a negative influence on users' persuasiveness due to unexplainable discriminatory outcomes, calling for responsible AI frameworks within organizations.

Jan, 2022

测量历史文献中的交叉偏见

本文通过时间序列的词汇联想分析，以及针对 OCR 错误引入噪音的技术处理，研究了加勒比地区殖民时期（18 世纪到 19 世纪）历史报纸中性别、种族偏见的连续性和转化。研究结果表明，种族和性别偏见是相互依存的，两者的交叉触发了不同效应，这与交叉性理论一致。

May, 2023

方言偏见对人物品行、就业能力和犯罪预测的人工智能决策

语言模型体现了隐蔽种族主义和方言偏见，并对使用者作出不公平的建议，这对语言技术的公正和安全就具有深远影响。

Mar, 2024

研究 200 个情感分析系统中的性别和种族偏见

本研究提供了第一个特意设计用于检测系统中不当偏见的基准数据集，即 Equity Evaluation Corpus (EEC)，基于此数据集，我们研究了参加 SemEval-2018 任务 1 的 219 个自动情感分析系统，发现其中多个系统在种族或性别方面存在显著的偏差，结果揭示了自动机器学习系统可能会自发强化和永久化不当偏见或歧视。

May, 2018

自然语言处理中种族、种族主义和反种族主义综述

通过调查 ACL 文献集中涉及种族的 79 篇论文，发现 NLP 模型开发各阶段都存在各种类型的种族相关偏见，并强调需要积极考虑如何维护种族等级制度，但在种族和 NLP 研究方面仍存在缺口：将种族作为固定单一维度变量运作，对历史上种族歧视造成的差异加以强化；在 NLP 文献中历史上处于边缘的特定人群的声音几乎没有被重视。因此，我们的工作呼吁在 NLP 研究实践中包容种族和实现种族公正。

Jun, 2021

关于仇恨言论和辱骂语言检测数据集中的种族偏见问题

本文研究了五个 Twitter 数据集上使用的基于分类器的识别恶意语言的技术中的种族歧视问题，并在使用这些技术时可能产生的不平等负面影响上发出了警告。

May, 2019

自然语言语料库所自动生成的语义带有类似人类的偏见

这份研究首次展示，应用标准机器学习到日常语言时会形成类似于人类的语义偏见，同时该研究还提供了用于评估文本偏见的新方法。

Aug, 2016