AAAIAug, 2020

Bagging 方法抵抗数据污染攻击的内在认证鲁棒性

TL;DR本文研究了机器学习训练集中存在的数据污染攻击以及集成学习中的 Bootstrap Aggregating 方法可以预防此类攻击。我们证明了 Bagging 可以在随机采样训练集的基础上使用多个基础模型进行学习,并在测试时使用多数表决方法进行预测,在受到污染的数据范围内,仍然能够是预测结果正确的概率保持不变。我们在 MNIST 和 CIFAR10 数据集上进行了实验,证明了该方法的正确性,同时开源代码供参考。