ACLMay, 2023
CHBias:中文对话语言模型的偏见评估与缓解
CHBias: Bias Evaluation and Mitigation of Chinese Conversational Language Models
Jiaxu Zhao, Meng Fang, Zijing Shi, Yitong Li, Ling Chen...
TL;DR本文介绍了一个新的中文数据集 CHBias,用于对中文会话语言模型进行偏见评估和缓解。试验结果表明,使用该数据集的去偏执方法可以减少生成具有社会偏见的文本,同时保持模型的对话功能。