BriefGPT.xyz
Ask
alpha
关键词
deep learning accelerators
搜索结果 - 5
Pruner: 高效的跨平台张量编译器
基于硬件和软件的深度学习加速器张量程序优化方法 Pruner,通过参数化静态分析器(PSA)和模式感知成本模型(PaCM)实现硬件感知性能分析和关键数据流模式的预测,再结合 Siamese 网络的动量迁移学习(MTL)策略以提高预训练成本模
→
PDF
5 months ago
带有卷积操作和且非卷积操作的 DNN 推理 / 训练性能分析
本文提出了一种针对深度学习加速器的性能分析框架 ——SimDIT,旨在覆盖卷积和非卷积操作,并提供详细的执行 CNN 推断和训练工作量的端到端性能统计,结果显示,在使用一个 64X64 处理阵列时,ResNet-50 训练工作量的非卷积操作
→
PDF
a year ago
异构 HPC 平台深度学习硬件加速器调查
该论文概述了近年来深度学习加速器的最新进展,并分类了最具影响力的架构和技术,以便提供给读者一个全面的视角,最终提供了一些关于深度学习加速器未来挑战的见解,例如量子加速器和光子学。
PDF
a year ago
自主驾驶中的深度学习加速器循环可靠性评估
本文提出了一个 DLA-in-loop 可靠性评估平台,用于解决自动驾驶中深度学习加速器(DLAs)可靠性评估中高级度量与底层度量不一致的问题。
PDF
a year ago
CVPR
移动设备上的图像去模糊部署:质量和延迟的视角
本文通过深入分析移动设备上的图像增强与修复应用,以图像去模糊任务为例,针对各类不同移动设备提出更好的质量 - 延迟权衡的可移植网络结构,并展示广泛应用的网络优化的有效性,旨在成功部署移动设备上的图像去模糊应用程序。
PDF
4 years ago
Prev
Next