BriefGPT.xyz
Ask
alpha
关键词
gpu kernels
搜索结果 - 3
使用深度序列模型预测最佳核调参
使用深度序列到序列模型预测 GPU 计算内核的最佳调优参数,能够准确学习 GPU 计算内核的性能动态,减少开发时间和计算资源。
PDF
3 months ago
MGARD:用于高性能、误差控制的数据压缩和重构的多格框架
MGARD 是一种提供了针对结构化和非结构化网格上的浮点科学数据的多网格自适应降维的软件,具有出色的数据压缩能力和精确的误差控制,可用于存储减少、高性能输入 / 输出和原位数据分析。它采用统一的应用程序编程接口 (API),可以在不同的计算
→
PDF
6 months ago
深度学习的稀疏 GPU 内核
本文提出一种基于稀疏矩阵的计算优化方法,通过对深度学习应用中的稀疏矩阵进行深入研究,开发出可用于稀疏矩阵与密集矩阵乘法和采样密集 - 密集矩阵乘法的高性能 GPU 核,实现了神经网络模型的加速和内存节省。
PDF
4 years ago
Prev
Next