Oct, 2023

关于资源受限的 FPGA 上基于时间序列 Transformer 模型的量化感知训练研究

TL;DR本研究探讨在时间序列 Transformer 模型上的量化感知训练(QAT),并提出了一种新颖的自适应量化方案,在 QAT 阶段动态选择对称和非对称方案。我们的方法证明了将量化方案与实际数据分布匹配可以减少计算开销同时保持可接受的精度。此外,我们的方法在应用于真实数据和混合精度量化时具有鲁棒性,其中大部分对象被量化为 4 位。我们的发现为模型量化和部署决策提供指导,同时为进一步发展量化技术奠定基础。