BriefGPT.xyz
大模型
Ask
alpha
关键词
violation categories
搜索结果 - 1
对 LLM 的越狱攻击进行全面评估
对大型语言模型 (也称为 LLMs) 的滥用进行了研究,发现存在越过社会伦理道德保障的破解攻击,相关研究呈现了不同的破解方法和违规类别,展示了破解提示的攻击效果,以及破解攻击与模型之间的转移性。这一研究强调了对不同破解方法进行评估的必要性,
→
PDF
5 months ago
Prev
Next