BriefGPT.xyz
Ask
alpha
关键词
performance loss
搜索结果 - 2
OpenBA-V2:使用快速多阶段剪枝达到 77.3% 的高压缩比
通过采用先进的训练目标和数据策略,OpenBA-V2 以最小的性能损失将 LLMs 压缩为更小的模型,这在资源有限的场景中有助于部署 LLMs。
PDF
2 months ago
RepQuant: 基于尺度重参数化的大型 Transformer 模型准确的后训练量化
提出了一种新型的后训练量化框架 RepQuant,通过量化推理解耦合范式,采用复杂的量化器进行量化过程,采用简化的量化器进行推理过程,同时将量化标度重新参数化,以确保准确的量化和高效的推理,并通过集成量化权重重构进一步提高性能限制,经过广泛
→
PDF
5 months ago
Prev
Next