Jun, 2024

FrenchToxicityPrompts:法文文本中评估和缓解有害性的大型基准

TL;DR我们创建并发布了 FrenchToxicityPrompts 数据集,评估了 14 种不同的大型语言模型对于 50K 个自然发生的法语提示及其延续的潜在有害性,并希望这一贡献能促进对除英语以外语言的有害性检测和缓解的未来研究。