May, 2023
TinyStories: 语言模型有多小才能够流利地说英语?
TinyStories: How Small Can Language Models Be and Still Speak Coherent
English?
TL;DR本文介绍了TinyStories数据集和一种新的评估语言模型的方法,该数据集使用GPT-3.5和GPT-4生成,只包含3到4岁儿童通常理解的单词。使用TinyStories可以训练和评估比现有模型小得多的语言模型,并引入新的评估范式来评估这些模型的语言能力和多维度的得分,例如语法、创造性和连贯性等。这可以促进低资源或专业领域的语言模型的发展、分析和研究,并提高对于语言模型能力的认识。