BriefGPT.xyz
Ask
alpha
关键词
activation outliers
搜索结果 - 2
添加前缀注意力节点以缓解大型语言模型量化中的激活值异常
提出了一种名为 CushionCache 的方法,通过防止生成问题标记,来促进每个张量的激活量化,成功解决了 LLMs 的激活离群值问题,并为每个张量的激活量化方法提供了显著的性能提升。
PDF
19 days ago
大语言模型中的权重量化激活异常值教训
本文提出了一种后训练量化方法,可以在不损失质量的情况下,在模型中针对 weight 使用较高的精度,大大降低了模型推理需要的 GPU 数量,实现了更高的经济性。
PDF
a year ago
Prev
Next