大型语言模型中的公平性偏差和去偏差之旅

May, 2023

大型语言模型中的公平性偏差和去偏差之旅

A Trip Towards Fairness: Bias and De-Biasing in Large Language Models

Leonardo Ranaldi, Elena Sofia Ruzzetti, Davide Venditti, Dario Onorati, Fabio Massimo Zanzotto

TL;DR这篇研究使用变换器语言模型研究了其训练数据所带来的偏见问题，并提出了一种去偏方法，得到的去偏模型在下游任务上保持了良好的表现。

Abstract

An outbreak in the popularity of transformer-based language models (such as GPT (Brown et al., 2020) and PaLM (Chowdhery et al., 2022)) has opened the doors to new Machine Learning applications. In particular, in Natural Language Processing and how →