Oct, 2022

GLM-130B: 一个开放式双语预训练模型

TL;DRGLM-130B 是一种双语预训练语言模型,拥有 1300 亿个参数。通过本文我们介绍了 GLM-130B 的训练过程、设计选择、训练策略、工程努力、以及它有别于其他模型的独特的可扩展性等特点。我们观察到该模型在学习效率和稳定性方面都有非常好的表现,并能在英文和中文语料库中显著地超越 ERNIE TITAN 3.0 和 GPT-3 175B 等知名模型,且有别于其他模型的独特的可扩展性,可以在相对较低的成本下进行使用。