Transformer 模型中的性别偏见：全面调查

Jun, 2023

Transformer 模型中的性别偏见：全面调查

Gender Bias in Transformer Models: A comprehensive survey

Praneeth Nemani, Yericherla Deepak Joel, Palla Vijay, Farhana Ferdousi Liza

TL;DR本篇论文从语言学角度全面调查了 Transformer 模型中的性别偏见，批判性地审查了现有文献关于 Transformer 中性别偏见的方法和度量标准，并提出了当前方法的局限性，强调了在开发和部署语言技术时，促进公平的重要性。

Abstract

gender bias in artificial intelligence (AI) has emerged as a pressing concern with profound implications for individuals' lives. This paper presents a comprehensive survey that explores →

gender bias artificial intelligence transformer models linguistic perspective measurement

发现论文，激发创造

机器翻译中的性别偏见与大型语言模型时代

本章检查了机器翻译在持续性别偏见方面的作用，强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT（基于 GPT-3.5）的实验，进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求，并强调了在语言技术中培养公平和包容的重要性。

Jan, 2024

揭示法学硕士职业领域中的性别偏见：分析与解决社会学意义

该研究探讨了大型语言模型中的性别偏见问题，特别关注 GPT-2 和 GPT-3.5 等多个语言模型之间的比较，通过对生成的文本进行全面的文献综述和定量分析，发现了性别化词汇关联、语言使用和偏见叙述的问题，并提出了减少性别偏见的算法和数据增强技术。该研究强调了学科间合作的重要性和社会学研究在减少 AI 模型性别偏见中的作用。

Jul, 2023

评估印地语 - 英语机器翻译中的性别偏见

本研究旨在评估和量化印地 - 英语机器翻译系统中的性别偏见，并实现了一种基于语法考虑的修改版本的现有 TGBI 度量标准，同时比较了预先训练的嵌入和我们的机器翻译模型所学习的嵌入的多个指标上产生的偏差测量结果。

Jun, 2021

AI 系统公平性：缓解语言视觉模型中的性别偏见

本研究尝试减轻语言视觉模型中的性别偏见问题，通过研究现有数据集中性别偏见的影响程度，并提出一种缓解方法。

May, 2023

利用人工法语数据理解转换器语言模型中性别偏见的出现

神经语言模型在没有直接监督的情况下学习各种语言属性的能力已被多个研究证明。本研究初步探索神经模型如何发现词语的语言属性（如性别）及其使用规则这一较少研究的主题。我们建议使用基于法语的 PCFG 生成的人工语料库来精确控制训练数据中的性别分布，并确定模型在何种条件下正确捕捉性别信息，或出现性别偏见。

Oct, 2023

评估大型语言模型中的性别和种族刻板印象

通过比较研究和建立评估框架，在专业环境中研究语言模型的两种偏见：性别和种族。我们发现，尽管较新的模型相比较老模型来说性别偏见大大减少，但种族偏见仍然存在。

Nov, 2023

大型语言模型中的性别偏见

我们研究了不同语言中大型语言模型生成的输出中的性别偏见，通过三项测量方法评估性别相关背景下选择描述性词语的性别偏见、选择性别相关代词（她 / 他）的性别偏见以及生成对话的主题的性别偏见。我们的研究表明，在我们调查的所有语言中都存在显著的性别偏见。

Mar, 2024

BERT 中的性别偏见 -- 通过情感评级测量和分析在现实下游分类任务中的偏见

本文分析 Bert 模型的性别偏见，并引入一种新的偏见度量，通过在训练管道中系统地改变元素来综合分析 BERT 的偏见，发现几乎所有条件下都存在重大的性别偏见，结果表明这些偏见源于公共 BERT 模型而非任务特定数据，强调了负责任的使用的重要性。

Jun, 2023

评估机器翻译中的性别偏见 -- 以 Google 翻译为例

本文研究了机器偏见和性别偏见，使用性别中性语言对 Google 翻译进行了实验，结果显示翻译的默认性别更偏向于男性，特别是在 STEM 领域中，这种偏见程度远超实际分布，因此需要对当前的统计翻译工具进行偏误纠正。

Sep, 2018

自然语言处理中的性别偏见调查

本文调查了 304 篇关于自然语言处理中的性别偏见的论文，分析了社会科学中性别及其类别的定义，并将其与自然语言处理中性别偏见的正式定义联系起来，概述了应用于性别偏见研究的词汇和数据集，并比较和对比了检测和缓解性别偏见的方法。我们发现性别偏见研究存在四个核心限制，提出了解决这些限制的建议作为未来研究的指南。

Dec, 2021