May, 2024

語言模型在有害言論檢測中表現出性別流?言論偏見

TL;DR对社交媒体平台上的内容审查进行分析,研究其对性别多元化言语模式的偏见,并提出五个现成的语言模型在评估这些文本的伤害程度时的性能评估。