关键词adversarial inputs
搜索结果 - 26
  • 扩散模型中的强鲁棒概念擦除修剪
    PDFa month ago
  • SemEval-2024 任务 2:临床试验安全的生物医学自然语言推理
    PDF3 months ago
  • 深度强化学习中对抗输入的分析
    PDF5 months ago
  • No-Skim: 针对基于略读的语言模型的效率鲁棒性评估
    PDF7 months ago
  • 自然语言处理健壮性中的胜利回声间传来的疑虑
    PDF8 months ago
  • 利用自然语言解释提高自然语言推理的上下文学习鲁棒性
    PDF8 months ago
  • LLM 能否遵循简单规则?
    PDF8 months ago
  • SmoothLLM: 对抗越狱攻击的大型语言模型防御
    PDF9 months ago
  • 压缩深度学习模型对抗鲁棒性基准测试
    PDFa year ago
  • URET: 通用鲁棒性评估工具包(用于规避)
    PDFa year ago
  • 突触可塑性模型与生物启发的无监督深度学习:综述
    PDFa year ago
  • gRoMA:测量深度神经网络全局鲁棒性的工具
    PDFa year ago
  • 指导卷积神经网络针对对抗输入进行重新训练
    PDF2 years ago
  • NMT 能理解我吗?朝着基于扰动的 NMT 模型代码生成评估的方向
    PDF2 years ago
  • ICML使用异常特征向量检测、分类和警告离群对抗样本
    PDF3 years ago
  • AAAI对抗攻击归因:发现对抗机器学习攻击中的可归因信号
    PDF3 years ago
  • 利用 k 近邻表示解释和改善模型行为
    PDF4 years ago
  • 深度强化学习的对抗状态不确定性可证明鲁棒性
    PDF4 years ago
  • 神经阅读理解过低敏感度
    PDF4 years ago
  • 动态模型应对相关性攻击研究议程
    PDF5 years ago
Prev