Jun, 2024

ViT-1.58b:1-bit 时代的移动视觉 Transformer

TL;DRViT-1.58b 是一种新的 1.58-bit 量化的视觉 Transformer 模型,通过三值量化的方式来平衡效率和准确性,实现了在存储和计算开销方面的高效扩展。实验证明,ViT-1.58b 与全精度 ViT 相比,在减少存储使用和计算成本方面取得了显著的成果,从而突出了极端量化技术在开发可持续的人工智能解决方案方面的潜力,并为实际应用中高效模型部署的广泛讨论做出了贡献。