May, 2024
视觉 Transformer 模型量化和硬件加速:综述
Model Quantization and Hardware Acceleration for Vision Transformers: A Comprehensive Survey
Dayou Du, Gu Gong, Xiaowen Chu
TL;DRVision Transformers(ViTs)的模型量化和硬件加速方面进行了综合调查,探讨了 ViTs 的独特架构特性、运行时特性、模型量化的基本原则,以及用于 ViTs 的最新量化技术的比较分析。此外,还探索了量化 ViTs 的硬件加速,强调了硬件友好算法设计的重要性,并讨论了未来的挑战和研究方向。