Jan, 2024

生成 AI 的红队测试:是银弹还是安全娱乐?

TL;DR通过对 AI 工业界最近的红队活动案例和相关研究文献的调查,我们发现先前的 AI 红队方法和实践在多个方面存在差异,包括活动目的、评估对象、实施方式和所得出的决策。鉴于我们的发现,我们认为虽然红队可能是一个有价值的广义概念,用于描述一系列旨在改善 Generative AI 模型行为的活动和态度,但宣称红队是解决一切可能风险的万灵药则属于安全戏剧。为了更好地评估生成 AI,我们将我们的建议综合成一个问题库,旨在指导和规范未来的 AI 红队实践。