Jun, 2023

掩盖语言模型和下游情感分类任务中对 93 个受污名化群体的偏见

TL;DR本研究旨在通过检测自然语言处理中的倾向性,确定人工智能模型的偏见和风险,并揭示这些模型对社会中处于弱势地位、受到歧视的群体的影响。结果表明,预训练的 MLMs(Masked Language Models)和他们的下游情感分类器存在着对社会中处于弱势地位、受到歧视的群体的偏见。