BriefGPT.xyz
大模型
Ask
alpha
关键词
hardware acceleration
搜索结果 - 23
通道调节神经网络
本研究介绍了通道门控(channel gating)方法,该方法是动态、细粒度且硬件高效的裁剪方案,能够通过跳过对分类结果没有贡献的输入通道的计算,优化卷积神经网络。实验证明,该方法能够在几乎不损失准确度的情况下,实现浮点运算量减少 2.7
→
PDF
6 years ago
GANAX:用于生成对抗网络的统一 MIMD-SIMD 加速器
本论文提出了一种名为 GANAX 的新型加速器设计,旨在解决深度生成对抗网络中的卷积精度和硬件加速效率问题,利用重新组织输出计算以及 MIMD-SIMD 统一设计等策略,有效加速了 GAN 的训练和运行。
PDF
6 years ago
基于 FPGA 的深度学习:过去、现在和未来
本文综述以硬件加速为视角,探讨深度学习及可编程门阵列的发展趋势和革新,旨在讨论 FPGAs 在更好地为深度学习社区提供服务方面的最佳应用。
PDF
8 years ago
Prev
Next