BriefGPT.xyz
Ask
alpha
关键词
dl training
搜索结果 - 2
与硬件协同设计模型架构的案例
通过仔细考虑 GPU 上执行的基础计算核心的各种模型超参数对模型形状效率的影响,我们提供了一套指南,以最大化用户的 Transformer 模型的运行时性能。通过优化模型形状,与具有类似参数但形状未经优化的模型相比,高效模型形状的吞吐量提高
→
PDF
5 months ago
ICML
MCTensor:一种带有多组分浮点的高精度深度学习库
本文介绍了 MCTensor,这是基于 PyTorch 的库,提供 DL 训练的通用和高精度算术,在相同的 PyTorch Tensor 方式下,我们实现了多个基本的矩阵级计算运算符和 NN 模块,我们评估了 MCTensor 算术与 Py
→
PDF
2 years ago
Prev
Next