BriefGPT.xyz
大模型
Ask
alpha
关键词
parallelism strategy
搜索结果 - 1
PanGu-$α$: 大规模自回归预训练中文语言模型及自动并行计算
本文介绍了在 MindSpore 框架下使用 2048 Ascend 910 AI 处理器集群训练了包含 2000 亿个参数的 PanGu-alpha 预训练语言模型及其并行算法,测试了其在各种场景下的生成能力 (包括文本摘要、问答、对话生
→
PDF
3 years ago
Prev
Next