Jun, 2024

MEAT: 提高强健性和泛化能力的中值集成对抗训练

TL;DR自主集成对抗训练方法在不同训练时期通过集成模型,如模型权重平均化(WA),提高模型的健壮性。然而,先前的研究表明,对抗训练中的自主集成防御方法仍然存在健壮过拟合问题,严重影响泛化性能。为解决这个问题,本文目的在于解决权重空间异常值的影响,提出了一种易于操作且有效的中位数集成对抗训练(MEAT)方法,通过搜索历史模型权重的中位数来解决自主集成防御中存在的健壮过拟合现象。实验结果表明,MEAT在强大的AutoAttack攻击下表现出最佳的健壮性,并且能够有效缓解健壮过拟合。我们进一步证明,大多数防御方法与MEAT相结合可以提高健壮泛化性和健壮性。