May, 2022

多元加权平均用于区分分布外泛化

TL;DR本文介绍了一种新的权重平均策略——Diverse Weight Averaging (DiWA),通过多次独立训练获得的模型权重进行平均,以增加模型的功能多样性,并提出了一种新的误差分解方法来说明多模型平均在测试期间建模分布发生变化时成功的原因,并通过实验证明,DiWA在不增加推理开销的情况下始终提高了 DomainBed 基准的表现。