关键词adversarial suffixes
搜索结果 - 4
  • AmpleGCG: 学习一种通用且可传输的对抗后缀生成模型,用于破解开放和关闭的 LLM
    PDF3 months ago
  • 由噪音到清晰:通过文本嵌入的翻译解开大型语言模型攻击的对抗后缀
    PDF4 months ago
  • TRAP: 针对黑盒识别的有针对性随机对抗提示诱饵
    PDF5 months ago
  • 使用困惑度检测语言模型攻击
    PDF10 months ago
Prev
Next