Sep, 2023

量化生成模型的 Softmax 偏差校正

TL;DR研究通过离线偏差校正技术改善了量化后的 softmax,在资源受限的边缘设备上推理能力得到了显著的准确性提升。