BriefGPT.xyz
大模型
Ask
alpha
关键词
trillion-parameter language model
搜索结果 - 1
PanGu-Σ: 用稀疏异构计算实现万亿参数语言模型
本文介绍了使用 MindSpore 在 Ascend 910 人工智能处理器集群上训练的具有 1.085T 参数的 PanGu-Sigma 语言模型,其使用 Random Routed Experts (RRE) 的密集 Transform
→
PDF
a year ago
Prev
Next