BriefGPT.xyz
Ask
alpha
关键词
variable precision
搜索结果 - 1
从 Llama2 7B 权重的无损(~1.5:1)压缩算法到 CNNs 和 LLMs 的可变精度、可变范围、压缩数值数据类型
这篇论文介绍了一种简单的无损压缩算法,用于处理大型语言模型的权重,可在 AMD FPGAs 中实现,并能每秒处理超过 8 亿个 bfloat16 数字。该算法被扩展应用于可变精度、可变范围的数值数据类型,并讨论了基于 ANS(非对称数系统)
→
PDF
3 months ago
Prev
Next