Mar, 2024

转换器中非线性操作的遗传量化感知近似

TL;DR本文提出了一种基因 LUT 逼近算法,用于优化 Transformers 中的非线性函数的手段,该算法通过量化意识自动确定参数,并在常规和线性 Transformer 模型上实现可忽略的性能下降,同时实现了 81.3~81.7% 的面积节省和 79.3~80.2% 的功耗降低。