BriefGPT.xyz
大模型
Ask
alpha
关键词
outlier activations
搜索结果 - 2
高级异常管理和低延迟闪存器件的高效旋转和置换
本研究提出了一种创新的量化策略 ——DuQuant,采用旋转和置换变换更有效地消除异常激活,并在多个任务中表现出卓越的异常值管理能力,即使在 4 位权重 - 激活量化下也能取得顶级结果。
PDF
a month ago
QuantTune: 自适应异常值驱动的模型量化优化
我们的研究着重于发现 Transformer-based 模型在后训练线性量化过程中准确性下降的潜在原因,并提出了一种适用于量化的微调方法 QuantTune。该方法通过根据异常激活的偏差调整权重,有效控制了有问题激活的动态范围,从而在几种
→
PDF
4 months ago
Prev
Next