BriefGPT.xyz
大模型
Ask
alpha
关键词
instance-aware group quantization
搜索结果 - 1
CVPR
视觉 Transformer 的实例感知组量化
后训练量化(PTQ)是一种高效的模型压缩技术,它使用一个小的校准样本集对预训练的全精度模型进行量化,而无需重新训练。我们提出了一种针对视觉变换器(ViTs)的实例感知分组量化技术(IGQ-ViT),它动态地将激活图的通道分割为多个组,以使每
→
PDF
3 months ago
Prev
Next