Jun, 2024
ViT-1.58b:1-bit时代的移动视觉Transformer
ViT-1.58b: Mobile Vision Transformers in the 1-bit Era
TL;DRViT-1.58b是一种新的1.58-bit量化的视觉Transformer模型,通过三值量化的方式来平衡效率和准确性,实现了在存储和计算开销方面的高效扩展。实验证明,ViT-1.58b与全精度ViT相比,在减少存储使用和计算成本方面取得了显著的成果,从而突出了极端量化技术在开发可持续的人工智能解决方案方面的潜力,并为实际应用中高效模型部署的广泛讨论做出了贡献。