BriefGPT.xyz
大模型
Ask
alpha
关键词
qft
搜索结果 - 2
QFT:量子化的低资源 LLM 全参数调整
提出了一种名为 QFT 的新型量化全参数调优框架,可以实现内存高效调优而不损害性能。该框架采用高效的 Lion 优化器和整数值量化的模型状态存储方法,并提供了梯度流和参数更新方案。结果表明,QFT 将模型状态内存减少到标准解决方案的 21%
→
PDF
9 months ago
ECCV
QFT:通过快速联合微调所有自由度进行后训练量化
提出了一种硬件意识的量化网络参数化方法 —— 量化感知微调(QFT),可以通过联合端对端微调实现一步到位的量化,获得与最优结果相当的 4 位权重量化结果。
PDF
2 years ago
Prev
Next