BriefGPT.xyz
Ask
alpha
关键词
inference speed improvement
搜索结果 - 2
噪声训练解锁语言模型并行推理能力
通过引入噪声训练模型的 Make Some Noise(MSN)框架和基于树的检索增强 Jacobi(TR-Jacobi)解码策略,可以改进大型语言模型的推断速度,提高并行解码能力,并且通过在不影响模型性能的情况下在推断阶段获得 2.3-2
→
PDF
11 days ago
二进制和三进制变压器的机理解释性
研究表明,将二进制和三进制变压器网络应用于大型语言模型能够显著减少内存并提高推理速度,并且研究结果显示,这些网络在学习模块化加法时与全精度变压器网络学习的算法相似,因此无法作为语言模型中更可解释的替代方案。
PDF
a month ago
Prev
Next