ACLMay, 2023

CHBias:中文对话语言模型的偏见评估与缓解

TL;DR本文介绍了一个新的中文数据集 CHBias,用于对中文会话语言模型进行偏见评估和缓解。试验结果表明,使用该数据集的去偏执方法可以减少生成具有社会偏见的文本,同时保持模型的对话功能。