Dec, 2023
SimQ-NAS: 同時量化策略與神經架構搜尋
SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture
Search
TL;DR通过使用多目标搜索算法与轻度训练的预测器相结合,我们展示了在准确性、模型大小和延迟等不同性能目标中,我们的方法在ViT、BERT、BEiT-3和ResNet等转换器和卷积网络的架构上比各自的基准表现更好,特定网络的性能提升在延迟方面最高达到4.80倍,在模型大小方面最高达到3.44倍,与全量化INT8基准相比准确性不降低。