关键词jailbreaks
搜索结果 - 6
- 通过密码字符对大型语言模型进行越狱以对抗审核管控PDFa month ago
- 大型语言模型中非标准 Unicode 字符对安全和理解的影响PDFa month ago
- 对控制权空洞越狱的强制拒绝PDF5 months ago
- COLD-Attack: 使用隐秘性与可控性越狱线性语言模型PDF5 months ago
- GUARD:通过角色扮演生成自然语言越狱以测试大型语言模型的指南遵循性PDF5 months ago
- 欺骗 LLMs 反抗:理解、分析和预防越狱PDFa year ago
Prev
Next