BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-core cpus
搜索结果 - 5
HEAT: 面向 CPU 的协同过滤推荐高效易用的训练系统
本文针对 Collaborative filtering 中的 state-of-the-art 方法 SimpleX 在 multi-core CPUs 表现欠佳的问题,提出了一种名为 HEAT 的高效 CF 训练系统,通过瓦片 embe
→
PDF
a year ago
高速并行贝叶斯网络结构学习
本文提出了一种基于多核 CPU 的快速解决方案 Fast-BNS,用于加速贝叶斯网络结构学习,通过动态工作池设计、CI 测试分组、缓存友好数据存储和实时生成条件集等优化措施,实现了对处理时间和内存使用的有效控制,并在综合实验研究中证明了其相
→
PDF
2 years ago
贝叶斯网络的快速并行精确推断:海报
提出了一种基于多核 CPU 的快速贝叶斯网络准确推理解决方案 Fast-BNI,通过混合粗粒度和细粒度并行技术增强准确推理的效率,并进一步简化瓶颈操作。
PDF
2 years ago
MM
卷积神经网络优化的分析特征及设计空间探索
本文针对机器学习的核心算法,即卷积神经网络,提出了一种基于解析建模的循环级别优化方案,该方案可以在多核 CPU 中实现与现有自动调优工具相媲美或更高的性能。
PDF
3 years ago
现代 CPU 上 FFT 卷积比 Winograd 更快,这是为什么
比较了三种高度优化的实现方式(常规 FFT、Gauss-FFT 和 Winograd-based convolution)在现代多核和众核 CPU 上的效果,并使用 Roofline 性能模型对三种方法的计算阶段进行了详细的分析,结果显示
→
PDF
6 years ago
Prev
Next