关键词jailbreaks
搜索结果 - 6
  • 通过密码字符对大型语言模型进行越狱以对抗审核管控
    PDFa month ago
  • 大型语言模型中非标准 Unicode 字符对安全和理解的影响
    PDFa month ago
  • 对控制权空洞越狱的强制拒绝
    PDF5 months ago
  • COLD-Attack: 使用隐秘性与可控性越狱线性语言模型
    PDF5 months ago
  • GUARD:通过角色扮演生成自然语言越狱以测试大型语言模型的指南遵循性
    PDF5 months ago
  • 欺骗 LLMs 反抗:理解、分析和预防越狱
    PDFa year ago
Prev
Next