May, 2024

量化 LLM 中上下文推理效应和记忆效应

TL;DR我们提出了一个公理系统来定义和量化大型语言模型(LLM)用于语言生成的精确记忆和上下文推理效应,并将这些效应形式化为 LLM 编码的令牌 / 词之间的非线性相互作用。实验表明,记忆效应和上下文推理效应的明确区分使得可以直观地检查 LLMs 编码的详细推理模式。