Dec, 2021

语言模型的扩展:方法、分析与训练经验

TL;DR本文通过对转换器为基础的语言模型在不同规模下的性能分析,证明规模越大,其在阅读理解、事实检查和鉴别有害语言等方面的性能提高最大,但在逻辑推理和数学推理等方面的收益较少。此外,本文还介绍了训练数据集和模型行为的综合分析,探讨了语言模型在 AI 安全和减轻下游危害中的应用。