Jun, 2024

HLQ: 基于 Hadamard 低秩量化的快速高效反向传播

TL;DR通过引入一种名为 Hadamard Low-rank Quantization (HLQ) 的优化策略,该研究主要关注在降低卷积和线性层的反向传播成本,在从头训练和微调过程中实现显著的内存节省和加速,并且获得了卓越的性能表现。