Jun, 2024

日本大型语言模型中社会偏见分析

TL;DR通过构建基于英文偏见基准 BBQ 的日语偏见基准数据集 JBBQ,并分析日本 LLM 的社会偏见,本研究发现,虽然当前的日本 LLM 通过指导调整提高了在 JBBQ 上的准确性,但其偏见程度却增加了。此外,通过在提示中加入关于社会偏见的警告,可以减轻某些模型中的偏见影响。