Dec, 2023

SimQ-NAS: 同時量化策略與神經架構搜尋

TL;DR通过使用多目标搜索算法与轻度训练的预测器相结合,我们展示了在准确性、模型大小和延迟等不同性能目标中,我们的方法在 ViT、BERT、BEiT-3 和 ResNet 等转换器和卷积网络的架构上比各自的基准表现更好,特定网络的性能提升在延迟方面最高达到 4.80 倍,在模型大小方面最高达到 3.44 倍,与全量化 INT8 基准相比准确性不降低。