Sep, 2023

考虑所有标签来评估预训练语言模型在自然语言推理中的性别偏见

TL;DR本文提出了一种考虑自然语言推理任务中所有标签的评估方法来评估预训练语言模型中的偏见,并通过对多种语言的模型进行元评估,证明该方法能够更准确地评估偏见。此外,本文还是首次在日语和中文的自然语言推理任务中构建评估数据集并测量预训练语言模型的偏见倾向。