May, 2024

P$^2$-ViT: 完全量化的视觉变换器的二次幂后训练量化和加速

TL;DRVision Transformers(ViTs)在计算机视觉任务中表现卓越,但它们在资源受限设备上的部署受到内存消耗和计算密集性的挑战。为了解决这个限制,我们提出了第一个适用于 P2-ViT 的后训练量化和加速框架,通过专门的量化方案有效量化 ViTs,并设计硬件加速器和数据流来提高效率。