BriefGPT.xyz
Ask
alpha
关键词
quantization policy
搜索结果 - 2
SimQ-NAS: 同時量化策略與神經架構搜尋
通过使用多目标搜索算法与轻度训练的预测器相结合,我们展示了在准确性、模型大小和延迟等不同性能目标中,我们的方法在 ViT、BERT、BEiT-3 和 ResNet 等转换器和卷积网络的架构上比各自的基准表现更好,特定网络的性能提升在延迟方面
→
PDF
7 months ago
BatchQuant: 鲁棒量化器的量子化全架构搜索
我们提出了 BatchQuant,这是一种稳健的量化器公式,可在数量少得多的 GPU 小时内训练出一种超过 10^{76} 个量化子网的紧凑超网,并首次无需重新训练即可无缝扩展一次权重共享 NAS 超网以支持任意超低位宽混合精度量化策略的子
→
PDF
3 years ago
Prev
Next