关键词adversarial perturbations
搜索结果 - 221
  • 相似度度量对基于文本可解释 AI 的本地替代模型的准确稳定性估计的影响
    PDF10 days ago
  • 对抗鲁棒分类器的一致收敛性
    PDF12 days ago
  • 特征映射协调:增强对抗鲁棒性的图卷积方法
    PDF15 days ago
  • 评估视觉状态空间模型的鲁棒性
    PDF19 days ago
  • 可解释的图神经网络挑战
    PDF22 days ago
  • 针对易样本的扰动改善目标对抗可迁移性
    PDF24 days ago
  • ACLAI 生成文本检测器对抗扰动的鲁棒性研究
    PDFa month ago
  • 调查和揭示卷积神经网络对对抗扰动的特征级漏洞
    PDFa month ago
  • ACL揭示 NLG 评估器的致命弱点:由大型语言模型驱动的统一对抗框架
    PDFa month ago
  • 通过数据本地化对稀疏对抗扰动进行认证鲁棒性
    PDFa month ago
  • 在对抗性攻击下实现不确定性校准的认证
    PDFa month ago
  • 通过音频风格转换评估自动语音识别系统的鲁棒性
    PDF2 months ago
  • 跨输入认证培训:通用扰动
    PDF2 months ago
  • 因果感知启示的信任图像质量评估的表示学习
    PDF2 months ago
  • ACL通过自去噪平滑提高大型语言模型的稳健性
    PDF2 months ago
  • 频率驱动的对抗样本的一种新视角
    PDF3 months ago
  • LRR: 基于语言驱动的可重采样连续表示抵抗对抗追踪攻击
    PDF3 months ago
  • 认证的 PEFTSmoothing:具有随机平滑的参数高效微调
    PDF3 months ago
  • 元不变性防御:对未知对抗性攻击具有普适健壮性
    PDF3 months ago
  • 扩散模型中针对样式模仿的无感知保护
    PDF3 months ago
Prev