BriefGPT.xyz
Jun, 2023
揭示语言模型能力结构
Revealing the structure of language model capabilities
HTML
PDF
Ryan Burnell, Han Hao, Andrew R. A. Conway, Jose Hernandez Orallo
TL;DR
本研究通过贝叶斯和频率分析结合,从29个LLM的数据中分析出LLMs的能力结构,发现LLMs的能力不是单一的,而是可以被解释为三个能力:推理、理解和核心语言建模,并且这三个能力可以解释模型性能的高比例差异,可以用来指导模型的改进和评测。
Abstract
Building a theoretical understanding of the
capabilities
of
large language models
(
llms
) is vital for our ability to predict and explain t
→