Jul, 2023

大型语言模型中的上下文学习学习标签关系但非传统学习

TL;DR通过研究源自于上下文的学习能力、预训练和标签关系对大语言模型性能的影响,我们的研究发现 LLMs 通常会整合上下文标签信息,但预训练和上下文标签关系被区别对待。同时,模型并不会同等考虑所有上下文信息,这些发现有助于理解和调整 LLM 的行为。