BriefGPT.xyz
大模型
Ask
alpha
关键词
attention distortion
搜索结果 - 1
Bi-ViT: 推动视觉 Transformer 量化极限
介绍一种专门用于大规模预训练模型在硬件受限设备上快速部署的量化方法,并提出一种基于可训练缩放因子和排名感知蒸馏的 Binarized ViT 模型。该方法在 ImageNet 等数据集上都取得了较高的 Top-1 准确率,并在 FLOPs
→
PDF
a year ago
Prev
Next