BriefGPT.xyz
大模型
Ask
alpha
关键词
im2win
搜索结果 - 2
Im2win:GPU 上的高效卷积操作
本文提出了基于 im2win 的卷积范式,旨在通过持续的内存访问提高性能,并经过了优化技术的改进,与其他基于 cuBLAS 和 cuDNN 的卷积实现相比,内存占用少 23.1% 至 32.8%,性能提高了 3.5 倍至 155 倍。
PDF
a year ago
Im2win:基于 SIMD 结构的内存高效卷积
提出了一种名为 im2win 的内存高效数据转换算法,能够实现连续的内存访问和数据重用,从而大大降低内存开销,同时通过各种优化实现高性能二维卷积,平均可以将内存开销降低到 41.6%,相对于 im2col 和不使用数据转换,性能平均提高了
→
PDF
a year ago
Prev
Next