关键词defence mechanism
搜索结果 - 5
  • 表征加噪有效地预防语言模型的有害微调
    PDFa month ago
  • 对抗训练的高维模型:几何与权衡
    PDF5 months ago
  • 不冒犯,Bert—— 我只侮辱人类!对毒性检测神经网络的句子层次攻击
    PDF9 months ago
  • EMNLP针对 NLP 模型后门攻击的鲁棒性感知扰动防御 (RAP)
    PDF3 years ago
  • 通过异常检测在污染攻击中检测对抗训练样例
    PDF6 years ago
Prev
Next