探究OpenAI GPT3中的偏见与互联网教育

Jun, 2023

探究OpenAI GPT3中的偏见与互联网教育

Taught by the Internet, Exploring Bias in OpenAIs GPT3

Ali Ayaz, Aditya Nawalgaria, Ruilian Yin

TL;DR本研究探讨了自然语言处理模型中偏见及其避免技术的现有文献，包括为何首先解决偏见问题；此外，文中分析了这些技术在比过去更大的新型模型下的表现。为了实现这些目标，本文作者使用目前可由消费者使用的最大 NLP 模型 GPT3 进行了研究。通过使用 GPT3 开发申请人跟踪系统进行测试，其中主要关注了性别偏见而不是所有或多种类型的偏见。最终，考虑和测试了当前的减轻技术以测试其功能程度。

Abstract

This research delves into the current literature on bias in natural language processing models and the techniques proposed to mitigate the

发现论文，激发创造

自然语言处理中减轻性别偏见：文献综述

本文回顾了当今关于识别和减轻 NLP 中的性别偏置的研究，并分析了四种代表性偏置基础上的性别偏见和认识其方法，同时探讨了现有性别去偏方法的优缺点和未来的研究。

Jun, 2019

自然语言处理中偏差和公平性调查

本次调查分析了NLP模型的社会影响，探讨了NLP算法中存在性别、种族和文化偏见的根源，定义了公平性，并说明了NLP各个子领域如何减少系统存在的偏见，最终讨论了未来研究如何消除NLP算法中的有害偏见。

Mar, 2022

自然语言处理中不良偏见：避免度量危机

本文综述了自然语言处理技术的快速发展所带来的问题，尤其是如何检测这些技术中的偏见。作者讨论了适用于评估和改进这些偏见测量方法的心理测量学概念，并认为采用心理测量学词汇和方法可以使NLP偏见研究更有效和透明。

Nov, 2022

自然语言处理中社会人口统计信息偏差调查

本篇论文调查了209篇关于自然语言处理模型中的偏差的论文，提出了社会人口统计学偏见的定义，并确定了研究偏见的三个主要类别：偏见类型，偏见度量和去偏见。作者总结说，目前的去偏见技术是肤浅的，不能真正消除偏见；最后提供了未来工作的建议。

Jun, 2023

走向一种整体方法：通过跨学科视角理解自然语言处理模型中的社会人口偏差

快速增长的自然语言处理在各种社会技术解决方案中的使用和应用突显了对偏见及其对社会的影响的全面理解的需求。虽然NLP中的偏见研究得到了扩展，但仍存在一些需要关注的挑战，包括有限地关注种族和性别以外的社会人口偏见、主要集中在模型上的狭窄分析范围，以及技术为中心的实施方法。本文解决了这些挑战，并倡导一种更加跨学科的方式来理解NLP中的偏见。该工作分为三个方面，每个方面探索NLP中的特定偏见方面。

Aug, 2023

大型语言模型中的偏见和公平性研究综述

大型语言模型中的社会偏见评估和缓解技术的综述，介绍了社会偏见与公平的概念、评估指标和数据集，以及介绍了干预方法的分类和研究趋势，帮助研究人员和实践者更好地理解和防止偏见在大型语言模型中的传播。

Sep, 2023

OpinionGPT: 模拟指导调整的LLMs中的显式偏见建模

通过 OpinionGPT 演示，我们展示了 OpinionGPT 网页应用，用户可以提问并选择他们希望调查的各种偏见。通过对代表不同偏见的文本进行 fine-tuning，提供模型答案的比较，以增强透明度和显性化地处理偏见。

Sep, 2023

ChatGPT中的性别偏见有多普遍？--探索德语和英语ChatGPT的回答

分析ChatGPT对有性别偏见和提示分析的系统回应，检查其可用性和限制。

Sep, 2023

GPTBIAS：评估大型语言模型中的偏差的综合框架

我们提出了一个名为GPTBIAS的偏见评估框架，它利用LLMs的高性能来评估模型的偏见，提供偏见分数以及包括偏见类型、受影响的人群、关键词和改进建议在内的详细信息，通过广泛的实验证明了该评估框架的有效性和可用性。

Dec, 2023

大型语言模型中的偏见解读：一种基于特征的方法

大型语言模型（LLMs）具有卓越的性能，在各种自然语言处理（NLP）任务中表现出色。本文通过一种新颖的基于特征的分析方法研究了LLMs内部偏见的传播。我们的发现揭示了LLMs中偏见的复杂性质并强调了定制的去偏方法的必要性，为有效缓解偏见机制和途径提供了更深入的理解。

Jun, 2024