Sep, 2024

利用监督毒性脆弱性增强自监督防御

TL;DR本研究解决了自监督学习在面对毒化数据时表现不佳的问题,提出了一种名为VESPR的新防御策略。通过在监督学习中引入对抗训练,VESPR成功地模糊化了毒化特征,显著提高了模型的鲁棒性,验证了其在七种常见毒化技术下的优越性能,平均提高了ImageNet-100测试准确率9%。