BriefGPT.xyz
大模型
Ask
alpha
关键词
mathematical aspects
搜索结果 - 1
深度学习推理的整数量化:原理与实证评估
本文介绍了量化技术如何减小深度神经网络的规模,提高推理延迟和吞吐量,并评估它们在各种应用领域的不同神经网络模型上的选择,包括视觉、语音和语言等方面,并重点介绍适用于高吞吐量整数数学流水线处理器加速的量化技术。同时,还提供了一种 8 位量化工
→
PDF
4 years ago
Prev
Next