性别是否重要？朝着对话系统公平的方向

COLINGOct, 2019

性别是否重要？朝着对话系统公平的方向

Does Gender Matter? Towards Fairness in Dialogue Systems

Haochen Liu, Jamell Dacon, Wenqi Fan, Hui Liu, Zitao Liu...

TL;DR本文通过构建基准数据集并提出量化措施来研究对话系统中的公平问题。研究发现，普遍采用的对话模型存在对不同性别和种族的偏见，并提出了两种简单而有效的去偏方法。数据集和实现已经发布以促进对话系统的公平研究。

Abstract

Recently there are increasing concerns about the fairness of Artificial Intelligence (AI) in real-world applications such as computer vision and recommendations. For example, recognition algorithms in computer vision are unfair to black people such as poorly detecting their faces and i

artificial intelligence fairness dialogue systems benchmark dataset debiasing methods

发现论文，激发创造

AI 系统公平性：缓解语言视觉模型中的性别偏见

本研究尝试减轻语言视觉模型中的性别偏见问题，通过研究现有数据集中性别偏见的影响程度，并提出一种缓解方法。

May, 2023

基于对抗学习减轻神经对话生成中的性别偏见

本文提出了基于对抗学习的、旨在降低对话系统中性别歧视的新框架 Debiased-Chat，并在两个真实的对话数据集上进行了广泛的实验，结果表明该框架明显降低了对话模型的性别偏见，同时保持了响应质量。

Sep, 2020

机器学习中的偏差与公正调查

调查表明，人工智能领域中存在各种偏见和不公，因此机器学习研究人员定义了公平性的分类，以解决现有 AI 系统中的偏见问题。此外，调查还考察了在 AI 的不同领域和子领域中，现有技术的问题及其应对措施，以期鼓励研究人员在其各自领域中研究此问题。

Aug, 2019

性别倾斜：通过属性操作实现计算机视觉模型的反事实公平性

本文提出了一种使用编码器 - 解码器网络开发的人脸图像合成方法，以测量商业计算机视觉分类器的反事实公平性，并报告了在线搜索服务中与职业相关的关键字中出现的偏向性，用以解释模型偏差的来源。

May, 2020

谁的偏好？公平偏好的差异及其对利用人类反馈的人工智能公平性的影响

通过从人类反馈中学习，我们考虑在内容审查中公平性的设置，在比较两个评论时，人类反馈被用来确定如何处理涉及不同敏感属性组的评论。我们发现，与注释者的种族、年龄、政治立场、教育水平和 LGBTQ + 身份有关，公平偏好存在显著差异，并且文本中提到的人口统计学信息对用户感知个体公平性有着强烈影响。此外，我们发现在预测人类偏好的下游分类器中也存在差异。最后，我们观察到在给定相等权重的不同人口统计注释训练的集成模型中，针对不同人口统计交叉部分表现更好，相比于给每个注释相等权重的单个分类器。

Jun, 2024

人工智能模型中的公平追求：一项调查

人工智能（AI）模型在我们的生活的各个方面得到广泛应用，如医疗、教育和就业。鉴于它们在许多敏感环境中使用并做出可能改变生活的决策，潜在的偏见结果成为一个紧迫问题。开发人员应确保这些模型不表现出任何意外的歧视做法，如对特定性别、种族或残疾人的偏袒。随着 AI 系统的广泛应用，研究人员和从业者对不公平的模型意识越来越强，并致力于减少其中的偏见。本文综述了研究人员在确保 AI 系统公平性方面所做的不同努力。我们探讨了当前文献中关于公平性的不同定义，通过对不同类型的偏见进行分类，研究了不同应用领域中存在的出现偏见的 AI 案例。我们对研究人员在减少 AI 模型偏见方面采用的方法和技术进行了详细研究。此外，我们还深入探讨了偏见模型对用户体验的影响以及在开发和部署此类模型时需要考虑的伦理问题。我们希望通过分享这份全面的综述，帮助研究人员和从业者理解 AI 系统中公平性和偏见的复杂问题。通过此综述，我们旨在促进公平和负责任 AI 领域的进一步讨论。

Mar, 2024

自然语言处理中偏差和公平性调查

本次调查分析了 NLP 模型的社会影响，探讨了 NLP 算法中存在性别、种族和文化偏见的根源，定义了公平性，并说明了 NLP 各个子领域如何减少系统存在的偏见，最终讨论了未来研究如何消除 NLP 算法中的有害偏见。

Mar, 2022

了解性别分类算法在不同性别 - 种族群体中的公平性

针对自动化性别分类系统在不同种族和性别群体中存在的差异性，本文分析了深度学习算法中的架构差异和训练集不平衡等潜在差异性来源，并在两个大规模的公开数据集上进行了实验。实验结果表明，不同算法的分类表现存在一致性，而且黑种女性和黑种族总体的准确率最低，中东男性和拉丁女性的准确率大多数情况下更高。同时提出骨骼结构受基因和环境因素影响的面部形态差异可能是黑种女性表现不佳的原因。

Sep, 2020

视觉和语言研究中实现更公平的神经模型的去偏置方法：一份调查报告

在电脑视觉和自然语言处理领域中，神经网络虽然能够取得最新成果，但是其存在数据内的建模偏见，导致人工智能领域出现了公平性的研究方向，其目的为了纠正算法偏见，提出了几种基于公平性的神经网络去偏置的方法。

Nov, 2022

从有偏倾向的训练数据中学习生成公平对话文本

This paper explores equitable text generation in dialogue systems using theories of computational learning, providing formal definitions of equity in text generation and proving formal connections between learning human-likeness and learning equity.

Jul, 2023