BriefGPT.xyz
大模型
Ask
alpha
关键词
bitlength
搜索结果 - 1
BitPruning: 学习位长进行激进而精确的量化
通过提出一种惩罚体系惩罚大位长表示的正则化方法,我们可以在维持准确性的同时,在任意合适的层次上最小化推理位长。
PDF
4 years ago
Prev
Next