BriefGPT.xyz
Ask
alpha
关键词
safety-utility tradeoff
搜索结果 - 1
CyberSecEval 2: 大型语言模型的广泛网络安全评估套件
大型语言模型引入新的安全风险,但缺乏综合评估套件来衡量和减少这些风险。我们提出了 BenchmarkName,这是一个用于量化 LLM 安全风险和能力的新型基准。我们介绍了两个新领域的测试:提示注入和代码解释器滥用。我们评估了多种最先进的
→
PDF
3 months ago
Prev
Next