Jul, 2023

KoBBQ:韩国问答偏见基准

TL;DR通过利用英文 BBQ 数据集以适应文化方式构建非英文偏见基准数据集,本文提出了 KoBBQ 数据集用于评估韩语问答任务中的偏见,并通过将韩国文化相关性增强到韩国文化,补充了四个韩国文化特定偏见类别,并基于韩国文学创建了新样本。使用 KoBBQ 数据集,衡量了几种最先进的多语言语言模型的准确性和偏见评分,展示了韩语和英语中语言模型的偏见差异,进一步阐明了考虑文化差异需要手工制作的数据的必要性。