Jun, 2023

CBBQ:一個由人工智能協作策劃的中文偏差測試數據集,供大型語言模型使用

TL;DR本文提供一个超过 10 万个问题的中文偏见基准数据集,包括与中国文化和价值观相关的 14 个社会维度中的刻板印象和社会偏见,通过广泛文献综述、生成环境、AI 辅助去歧义生成、手动审核和重组等步骤,展示了数据集的广泛覆盖和高多样性,实验表明所有 10 个公开可用的中文大型语言模型在某些类别中存在强烈的偏见。