关键词defense methods
搜索结果 - 51
  • 图 MU:通过机器取消学习来修复图神经网络的鲁棒性
    PDF13 days ago
  • 大型语言模型联邦指导调优中涌现的安全攻击与防御
    PDF17 days ago
  • 通过特征模式一致性约束提高对抗鲁棒性
    PDF19 days ago
  • 我不认识你,但我能够捕捉你:针对目标检测的多样对抗性补丁的实时防御
    PDF20 days ago
  • 通过特定层编辑来防御针对大型语言模型的越狱攻击
    PDFa month ago
  • CVPRPAD:面向对抗性贴纸攻击的面片无关防御
    PDF2 months ago
  • 基于掩码的目标检测隐形后门攻击
    PDF3 months ago
  • 图像识别上的对抗攻击多用途防御
    PDF4 months ago
  • 利用辅助对抗防御网络增强追踪的鲁棒性
    PDF4 months ago
  • 由噪音到清晰:通过文本嵌入的翻译解开大型语言模型攻击的对抗后缀
    PDF4 months ago
  • ProTIP: 针对随机扰动的文图扩散模型进行概率稳健性验证
    PDF4 months ago
  • AAAI图神经网络的简单而又相对有效的防御方法
    PDF4 months ago
  • SafeDecoding:通过安全感知解码防御越狱攻击
    PDF5 months ago
  • 重审梯度修剪:一种用于抵御梯度攻击的双重实现
    PDF5 months ago
  • 通过合作训练保护推荐系统
    PDF5 months ago
  • AR-GAN: 面向自动驾驶交通标志分类系统的对抗攻击的生成对抗网络防御方法
    PDF6 months ago
  • 对大型语言模型间接提示注入攻击的基准测试与防御
    PDF6 months ago
  • 持续对抗性防御
    PDF7 months ago
  • 狼穿羊皮:通用嵌套越狱引导轻易蒙骗大型语言模型
    PDF8 months ago
  • 以火攻火:使用模式随机化的防御贴片对抗拼贴攻击
    PDF8 months ago
Prev