Dec, 2020

CPM:一个大规模生成式中文预训练语言模型

TL;DR本文介绍了使用大规模的中文训练数据进行生成式预训练的中国预训练语言模型 (CPM)。CPM 是目前拥有最大的 26 亿参数和 100GB 中文训练数据的中文预训练语言模型,可用于解决多个中文 NLP 任务,并在少样本甚至零样本学习的设置下取得了较强的性能。