Jan, 2022

VAQF:面向低位视觉 Transformer 的全自动软硬件协同设计框架

TL;DR本研究提出了一种名为 VAQF 的框架,该框架可以在 FPGA 平台上为量化的 ViT 模型构建推理加速器,并且可以自动输出所需的量化精度和优化参数设置,以在硬件要求下满足所需的帧速率。通过对基于 DeiT-base 模型的实验结果的评估,实现表明可以在满足 24 帧每秒的帧速率要求的情况下使用 8 位激活量化,以及在使用 6 位激活量化的情况下可以达到 30 帧每秒的目标。