Nov, 2022

HEAT: Transformer 压缩的硬件高效自动张量分解

TL;DR本文提出了 HEAT 硬件感知张量分解框架,通过硬件感知的协同优化,实现了对参数冗余的降维和的自动调节,能够达到更好的能效比和精度。