Apr, 2022

毒素学得越快越有效

TL;DR研究发现,停止毒害对抗性攻击在整个数据集中的效果非常高,这种防御机制可以防止早期停止策略的实际使用,并为评估毒药的峰值测试准确性提供了一个可靠的方法。