BriefGPT.xyz
大模型
Ask
alpha
关键词
hardware optimization
搜索结果 - 4
基于 FPGA 设计的基于 CNN 的目标检测器中混合数据流和混合精度的分层优化
本文提出了一种针对卷积神经网络的硬件优化方案,该方案采用两种针对不同层次的特定优化法,实现不同的计算方式以提高性能,并在最大程度上减少了占用芯片的内存及对外部内存访问的需求,从而缓解了 CPU 的压力并大幅提升了处理速度。
PDF
4 years ago
RoadNet-RT: 实时道路分割的高通量 CNN 架构和 SoC 设计
本文提出了一种基于 CNN 网络的轻量级、高吞吐量的 RoadNet-RT 架构,通过深入优化硬件设计和使用分离深度卷积和非均匀核大小卷积等技术,显著提高了道路分割的实时处理速度。相较于现有最先进的网络,在仅仅 6.2% 的精度损失下,Ro
→
PDF
4 years ago
GPU 上 GCN 的特性与理解
本文通过对 GCNs 进行特征化并在 NVIDIA V100 GPU 上探索 GCN 模型,提出了一些有用的指南,以实现 GCNs 在 GPU 上高效执行的软件优化和硬件优化。
PDF
4 years ago
MM
使用随机运算的高可扩展深度卷积神经网络 SC-DCNN
本文设计了一种基于 SC 的 DCNN,并优化了其各个方面,包括内积、池化、激活函数、特征提取块、权重存储方法等,以实现高效、可扩展和节能的硬件优化。
PDF
8 years ago
Prev
Next