May, 2023

生成语言模型的统计知识评估

TL;DR采用潜在变量和 KaRR 指标引导的统计知识评估框架对 14 种生成语言模型 (GLMs) 进行全面比较;该研究表明,具有相同骨干结构的 GLMs 的知识符合缩放定律,并且在指令遵循数据上的调整可能会危及模型始终生成正确的文本的能力。