Apr, 2024

SafetyPrompts: 评估和改进大型语言模型安全性的开放数据集的系统综述

TL;DR系统回顾了用于评估和改进大型语言模型安全性的开放数据集,研究了 102 个数据集,并发现了可用数据集的使用模式和趋势,以及数据集覆盖的缺口和目前评估实践的局限性。