Jan, 2023

CORGI-PM: 一个用于探测和缓解性别偏见的中文语料库

TL;DR提出了一种在中文语境下进行性别偏见标注的高质量标注语料库 CORGI-PM,其中包含 32.9k 个句子。同时,作者们还解决了文本性别偏见的自动去除中面临的三个挑战,即检测、分类和去除。作者观察到,这是首个用于性别偏见探测和去除的中文语境句子级语料库。