BriefGPT.xyz
Ask
alpha
关键词
hard labels
搜索结果 - 3
用预测的难样本标签重新训练可证明提高模型准确性
通过理论分析,在给定随机受损标签的线性可分情境中,重新训练可以提高模型的整体准确率,并且通过基于共识的重新训练方法在没有额外的隐私成本的情况下显著提高标签差分隐私训练的准确率。
PDF
20 days ago
ACL
VoteTRANS: 通过在转换的困难标签上投票检测敌对文本,无需训练
本文提出了一种名为 VoteTRANS 的检测方法,通过比较输入文本和其转换的硬标签来检测对抗性文本,无需基于原始数据或对抗数据进行训练,并且在各种最新的攻击、模型和数据集上表现良好。
PDF
a year ago
ICLR
使用不可靠的教师进行可信对抗蒸馏
提出一种新的神经网络训练方法,叫做可靠的内省式敌对蒸馏(IAD),用于提高神经网络对抗攻击的能力。通过在不同情况下,对不同来源的标签进行部分可信任处理,以提高神经网络的稳定性。实验结果表明,IAD 在提高抗对抗性方面的效果显著。
PDF
3 years ago
Prev
Next