BriefGPT.xyz
大模型
Ask
alpha
关键词
computational errors
搜索结果 - 2
评估零射击长上下文语言模型压缩
在长语境下,评估零样本压缩技术对大型语言模型 (LLMs) 的有效性,发现在应用某些压缩方法时,计算错误的趋势会增加。提出一种假设来解释不同 LLM 压缩技术的不同行为,并探索减轻某些技术在长语境下性能下降的方法。
PDF
24 days ago
AAAI
基于分块定点算术的卷积神经网络加速器设计中的计算误差分析
本文在不重新训练的情况下测试了几种经典的卷积神经网络 (CNN) 模型,验证了使用块浮点算法 (BFP) 在 CNN 加速器中定义字宽的效果,并探究了理论计算误差,提出了噪声信号比(NSR)的上限,为基于 BFP 的 CNN 引擎设计提供了
→
PDF
7 years ago
Prev
Next