BriefGPT.xyz
大模型
Ask
alpha
关键词
specialized hardware accelerators
搜索结果 - 1
为减少 DNN 加速器的片外数据访问而结合调度、内存分配和张量替换
通过一个名为 COSMA 的优化框架,我们能够在专用硬件加速器上为 DNNs 找到最佳的操作调度、内存分配和张量替换方式,从而最小化额外数据访问,同时通过分而治之的启发式方法可以将复杂 DNNs 的数据访问降低 85% 以上。
PDF
7 months ago
Prev
Next