BriefGPT.xyz
Ask
alpha
关键词
llm quantization
搜索结果 - 2
LLMEasyQuant - 一个易于使用的 LLM 量化工具包
LLMEasyQuant 是一个旨在简化量化部署的用户友好的包,适合初学者学习。
PDF
8 days ago
添加前缀注意力节点以缓解大型语言模型量化中的激活值异常
提出了一种名为 CushionCache 的方法,通过防止生成问题标记,来促进每个张量的激活量化,成功解决了 LLMs 的激活离群值问题,并为每个张量的激活量化方法提供了显著的性能提升。
PDF
19 days ago
Prev
Next