关键词high-performance computing systems
搜索结果 - 2
- 大规模个体 fMRI 数据集中脑编码的岭回归扩展
评估不同的并行化技术以减少在 CNeuroMod Friends 数据集上使用 ridge 回归进行脑编码的训练时间,结果显示 Intel Math Kernel Library 在单个机器上使用 32 个线程时比 OpenBLAS 库快 - QArchSearch:一套可扩展的量子架构搜索工具
基于 QTensor 库的 AI 量子架构搜索包 QArchSearch 能够高效扩展到大型量子电路,并在不同的量子应用中探索更复杂的模型。通过在 CPU 和 GPU 上采用两级并行化方案,在 Polaris 超级计算机上实现了大规模和高效