BriefGPT.xyz
Ask
alpha
关键词
latency-driven
搜索结果 - 1
Archtree: 基于实时树结构探索的深度神经网络低延迟裁剪
Archtree 是一种新的基于延迟驱动的 DNN 结构修剪方法,通过并行地在树形结构中探索多个候选修剪子模型,实时估计目标硬件的延迟,从而更好地适应延迟预算并保持原始模型准确性。
PDF
8 months ago
Prev
Next