BriefGPT.xyz
大模型
Ask
alpha
关键词
hardware resources
搜索结果 - 2
LQER: 低秩量化误差重建法用于 LLMs
本研究提出了一种通过低秩近似和量化相结合的方法,使用激活引起的比例矩阵将量化误差的奇异值分布调整到理想值,实现了在各种大型语言模型和相关任务上几乎无失真的 W4A8 量化,而无需知识蒸馏、网格搜索或基于梯度的迭代优化,并且与现有方法相比,计
→
PDF
5 months ago
动态提前退出预测编码神经网络
借鉴人脑的高效率和低功耗,本文提出了一种基于预测编码理论和动态提前终止的浅双向网络,以加入硬件有限资源在设计过程中,实现在 CIFAR-10 图像分类上与 VGG-16 相当准确率的结果,使用更少的参数和较低的计算复杂度。
PDF
10 months ago
Prev
Next