Nov, 2023

AART:多元数据生成的 AI 辅助红队技术用于新 LLM 技术应用

TL;DR通过自动生成敌对评估数据集,提供了一种新的方法,用于测试大型语言模型在新的下游应用中生成结果的安全性,为了减少人工工作量并能够更早地集成敌对测试,使用 AI 辅助的可重复和可定制的数据生成和增强流程,生成具有高内容特征多样性的评估数据集,结果显示与一些最先进的工具相比,在概念覆盖和数据质量方面具有很大的潜力。