Apr, 2023

自回归语言模型中事实关联的回忆解剖

TL;DR本文通过信息流的视角研究了基于 Transformer 的语言模型如何在推理过程中检索参数中的实际知识,并通过对模型中注意力机制的介入实现了对预测中信息流的详细分析和理解。通过此研究,我们阐述了在语言模型中实现知识局部化和编辑的方法。