BriefGPT.xyz
Ask
alpha
关键词
partially-binarized llm
搜索结果 - 1
PB-LLM:部分二元化大型语言模型
本文研究了网络二值化技术在大型语言模型(LLMs)压缩中的应用。通过提出一种新的方法,即部分二值化 LLMs(PB-LLM),我们能够在保持低位量化的同时保持 LLMs 的语言推理能力。我们通过后训练量化(PTQ)和量化感知训练(QAT)的
→
PDF
9 months ago
Prev
Next