关键词attack
搜索结果 - 26
  • 针对受攻击方策略访问有限的强化学习的行为目标攻击
    PDFa month ago
  • SALAD-Bench: 大型语言模型的分层与综合安全评估基准
    PDF5 months ago
  • 多模态大型语言模型在图像和文本上的安全性
    PDF5 months ago
  • BackdoorBench: 一个全面的后门学习基准和分析
    PDF5 months ago
  • EMNLP通过注入对抗性段落污染检索语料库
    PDF8 months ago
  • 多项式时间密码分析提取神经网络模型
    PDF9 months ago
  • 机器学习模型泄漏研究:对合成训练数据的探索
    PDF9 months ago
  • 理解开放域聊天机器人中的多轮有害行为
    PDFa year ago
  • 机器学习需要自己的随机性标准:随机平滑和基于伪随机数生成器的攻击
    PDFa year ago
  • ICML联邦学习中安全聚合的样本重新 ATTRIBUTION 攻击(SRATTA)
    PDFa year ago
  • 隐私保护机制在联邦学习中的应用
    PDFa year ago
  • 针对轮归约 Simeck32/64 的改进差分神经密码分析
    PDFa year ago
  • 面向未知分布的对抗鲁棒性
    PDF2 years ago
  • 为何如此有毒?:在开放领域聊天机器人中测量和触发有毒行为
    PDF2 years ago
  • 联邦学习语言模型中的私有文本恢复
    PDF2 years ago
  • MM找到 MNEMON:重现节点嵌入的记忆
    PDF2 years ago
  • CVPRNICGSlowDown: 评估神经图像字幕生成模型的效率鲁棒性
    PDF2 years ago
  • 使用白盒攻击和黑盒攻击逃避深度伪造图像检测器
    PDF4 years ago
  • 通过减少离散度增强对抗样本的跨任务黑盒可迁移性
    PDF5 years ago
  • CVPR通过平移不变攻击规避转移对抗样本的防御
    PDF5 years ago
Prev