Jun, 2024

Q-S5:朝向量化状态空间模型

TL;DR探索量化对 S5 模型的影响以及将其部署到边缘和资源受限平台的有效性。使用量化感知训练(QAT)和事后量化(PTQ)系统评估了 SSM 在不同任务上的量化灵敏度,研究结果表明,循环权重低于 8 位精度时,大多数任务的性能显著下降,而其他组件可以进一步压缩而不会引起显著的性能损失。此外,研究还发现 PTQ 在基于语言的任务上表现良好,而其他任务则需要 QAT。该研究为高效和硬件优化的 SSM 的持续发展提供了必要的见解。