关键词adversarial examples
搜索结果 - 773
  • 对大规模语言模型的对抗欺骗攻击效率
    PDF7 days ago
  • MeanSparse: 通过平均中心的特征稀疏化来增强训练后的鲁棒性
    PDF10 days ago
  • 缩小差距:对健壮和标准泛化的 Rademacher 复杂性
    PDF11 days ago
  • 解读 CLIP 神经元的二阶影响
    PDF13 days ago
  • HOLMES:使用多个检测器检测对抗样本
    PDF20 days ago
  • 针对安全定向 LLM 的改进对抗样本生成
    PDF22 days ago
  • PureEBM: 通过能量模型中间运行动力学实现的通用毒素净化
    PDF22 days ago
  • PureGen: 通用数据净化方法 —— 基于生成模型动态的训练时毒素防御
    PDF22 days ago
  • 通过邻域条件采样增强对抗性可转移性
    PDF25 days ago
  • 贝叶斯误差如何限制概率鲁棒准确性
    PDFa month ago
  • CVPR学习动态转化以提高对抗迁移性能
    PDFa month ago
  • 恶意软件检测中对抗性样本的零阶优化的新形式
    PDFa month ago
  • 文本分类器的对抗攻击的约束执行奖励
    PDFa month ago
  • 用于对抗鲁棒性的自适应批标准化网络
    PDFa month ago
  • 神经网络的认证稳健准确性由于贝叶斯误差有界
    PDFa month ago
  • 允许或禁止在量化网络之间转移对抗攻击的特性
    PDFa month ago
  • 关于通过扰动潜在表示进行文本分类的对抗性示例
    PDFa month ago
  • ReLU 是否具有对抗鲁棒性?
    PDFa month ago
  • ProFLingo:一种基于指纹技术的大型语言模型版权保护方案
    PDF2 months ago
  • 一种使用稳定扩散的防御对抗攻击的新方法
    PDF2 months ago
Prev