利用大型语言模型衡量性别化语言中的性别偏见

Jun, 2024

利用大型语言模型衡量性别化语言中的性别偏见

Leveraging Large Language Models to Measure Gender Bias in Gendered Languages

Erik Derner, Sara Sansalvador de la Fuente, Yoan Gutiérrez, Paloma Moreda, Nuria Oliver

TL;DR该论文介绍了一种利用大型语言模型对西班牙语语料库进行定量分析性别表达的新方法，通过识别和分类与人类实体相关的具有性别特征的名词和代词，揭示了四个广泛使用的基准数据集中存在的显著性别差异，从男性到女性的比例范围从4:1到6:1，这些发现证明了我们方法在性别语言中进行偏见量化的价值，并建议在自然语言处理中应用该方法，为更公平的语言技术发展做出贡献。

Abstract

gender bias in text corpora used in various natural language processing (NLP) contexts, such as for training large →

发现论文，激发创造

探讨具有语法性别的语言中的性别偏见

该研究提出了一种新的度量标准来评估西班牙语和法语等语言中的词嵌入性别偏见，并进一步证明了双语词嵌入与英文词嵌入存在性别偏见的一致性。同时作者还提供了一种新的方法用于缓解这种偏见。实验结果表明这些方法有效地减少了性别偏见，同时也保持了嵌入向量的实用性。

Sep, 2019

自然语言处理中的性别偏见调查

本文调查了304篇关于自然语言处理中的性别偏见的论文，分析了社会科学中性别及其类别的定义，并将其与自然语言处理中性别偏见的正式定义联系起来，概述了应用于性别偏见研究的词汇和数据集，并比较和对比了检测和缓解性别偏见的方法。我们发现性别偏见研究存在四个核心限制，提出了解决这些限制的建议作为未来研究的指南。

Dec, 2021

文本中的性别偏见：标记数据集和词库

该研究的主要贡献是，通过收集、注释和增强相关句子以促进检测英文文本中的性别偏见，公开提供已标记的数据集和详尽的词汇表，其中所包含的偏见子类型包括：通用他，通用她，明确标记性别和性别新词。同时，利用词嵌入模型进一步增强了所收集的词汇表。

Jan, 2022

在形态句法镜头下：对语音翻译性别偏见的多方位评估

通过对自然、性别敏感的MuST-SHE语料库进行POS和一致性链的语言学注释，在英法/意大利语/西班牙语三种语言方向上针对不同数量的数据和不同的词语分割技术进行多方面评估，揭示了性别偏见的模型行为，及其在多个细粒度层次上的检测价值。

Mar, 2022

偏见的诞生：一项关于英语语言模型中性别偏见演变的研究

研究发现使用 LSTM 架构训练的语言模型在表示性别时存在动态变化，并且性别信息逐渐局部化。通过监控训练动态，可以检测到女性和男性在输入嵌入中的表示不对称。去除偏见的策略如何应用需要更多深入探讨。

Jul, 2022

评估和减轻多语言环境中的性别偏见

这项研究探讨在多语言环境中评估和减少性别偏见在语言模型中的挑战，并通过 DisCo 扩展到不同的印度语言来创建了一个评估预训练屏蔽语言模型中性别偏见的基准，同时评估了各种方法对 SOTA 大规模多语言模型减轻此类偏见的有效性。

Jul, 2023

大型语言模型中的性别偏见

我们研究了不同语言中大型语言模型生成的输出中的性别偏见，通过三项测量方法评估性别相关背景下选择描述性词语的性别偏见、选择性别相关代词（她/他）的性别偏见以及生成对话的主题的性别偏见。我们的研究表明，在我们调查的所有语言中都存在显著的性别偏见。

Mar, 2024

从《Showgirls》到《Performers》：用包容性的性别语言对LLMs中的偏见进行微调

通过在大型语言模型（LLMs）的训练数据中调整语言结构以促进性别包容性，我们的研究关注英语中的性别排他性词缀，旨在减少性别定型倾向并提供一种实用方法增强LLMs训练数据中的性别包容性。

Jul, 2024

一个优雅的桥梁：多语言LLM在不同语言中的偏见相似

通过大型语言模型（LLMs）从语法性别的角度研究偏见，利用多语种LLMs重新审视和扩展Boroditsky（2003）的基础实验，发现简单的分类器不仅可以预测名词性别，还可以具有跨语言迁移能力，表明LLMs在不同语言中存在相似的偏见。

Jul, 2024

GenderCARE：评估和减少大型语言模型中性别偏见的综合框架

本研究针对大型语言模型（LLMs）在自然语言生成中放大性别相关社会偏见的问题，提出了GenderCARE框架，以构建灵活而全面的评估标准、偏见评估、减少技术及评估指标。研究表明，该框架能显著减少性别偏见，且在保持模型性能的同时，实现过90%的偏差降低，为实现LLMs的公平性和公正性提供了新的解决方案。

Aug, 2024