BriefGPT.xyz
Ask
alpha
关键词
tensor core
搜索结果 - 3
从不同的候选者学习,在张量核上优化降低精度卷积程序
这篇论文提出了一种基于 Tensor Core 和 MMA 指令的卷积操作优化方法,该方法通过自动调度探索线程块和 warp 尺寸的搜索空间,包括寄存器级 Packing 和布局优化等选项,使用学习算法找到最佳调度,从而比现有技术在 Ten
→
PDF
2 years ago
QGTC:使用 GPU 张量核加速量化图神经网络
该论文提出了一种基于张量核心的计算框架 QGTC,支持 GPU 上的 QGNN 的任何位宽计算,实验结果表明 QGTC 相对于 Deep Graph Library 框架平均加速了 2.7 倍。
PDF
3 years ago
NVIDIA Tensor Core 可编程性、性能和精度
本文介绍了 NVIDIA Volta GPU 微架构中一种特殊的处理器 Tensor Core,它能够在每个时钟周期内对 4x4 矩阵执行一个矩阵乘积累加操作,经过测试,我们发现 NVIDIA Tensor Core 在 Tesla V10
→
PDF
6 years ago
Prev
Next