Apr, 2024

MLCommons AI 安全基准 v0.5 发布

TL;DR介绍了 MLCommons AI 安全工作组创建的 AI 安全基准 v0.5,设计用于评估使用对话调整的语言模型的 AI 系统的安全风险。该基准采用了一个确定性的方法来指定和构建,并包括了 13 个危险类别的分类法,为 v0.5 版本提供了 7 个测试用例。