Apr, 2024

GhostNetV3:探索紧凑模型的训练策略

TL;DR在本文中,我们通过系统研究不同的训练方法,为紧凑型模型引入了一个强大的训练策略,发现改良的重新参数化和知识蒸馏的设计对于训练高性能的紧凑型模型至关重要,而一些用于训练常规模型的常用数据增强方法,如 Mixup 和 CutMix,会导致性能下降。我们在 ImageNet-1K 数据集上的实验表明,我们专门为紧凑型模型设计的训练策略适用于各种架构,包括 GhostNetV2、MobileNetV2 和 ShuffleNetV2。特别地,使用我们的策略,GhostNetV3 1.3 倍在移动设备上以仅 269M FLOPs 和 14.46ms 的延迟达到了 79.1% 的 top-1 准确率,远远超过了普通训练的对照组。此外,我们的观察结果还可以扩展到目标检测场景。