May, 2024

视觉 Transformer 模型量化和硬件加速:综述

TL;DRVision Transformers(ViTs)的模型量化和硬件加速方面进行了综合调查,探讨了 ViTs 的独特架构特性、运行时特性、模型量化的基本原则,以及用于 ViTs 的最新量化技术的比较分析。此外,还探索了量化 ViTs 的硬件加速,强调了硬件友好算法设计的重要性,并讨论了未来的挑战和研究方向。