BriefGPT.xyz
大模型
Ask
alpha
关键词
energy-efficient inference
搜索结果 - 2
硬件感知的 DNN 压缩:通过多样化剪枝和混合精度量化
通过联合采用修剪和量化,利用强化学习探索与低能耗相关的设计空间及其精度损失,我们提出了一种自动压缩深度神经网络的硬件感知框架,能够在嵌入式深度神经网络加速器上实现能耗最小化。实验结果表明,相比现有方法,我们的框架平均能耗降低 39%,平均精
→
PDF
6 months ago
通过解决嵌入式 FPGA 中 LSTM 单元的吞吐量瓶颈来增强能效
为了处理物联网 (IoTs) 中的传感器数据,本研究提出了一种嵌入式深度学习的重要技术,即 LSTM 细胞的优化,旨在实现端设备上的高效能推断。通过以交通速度预测为案例研究,利用优化的 LSTM 细胞的简单 LSTM 模型在 extit {
→
PDF
9 months ago
Prev
Next