Apr, 2023

针对数据效率的语言模型 MiniPile 挑战

TL;DR本文提出 MiniPile 挑战,呈现一种使用文本语料库的小数据集进行语言模型预训练的方法,其适用性通过在 GLUE 和 SNI 基准测试中得到论证。