Oct, 2023

语言模型中事实性回忆机制的表征

TL;DR利用头部归因方法控制模型行为,将模型表现局部化,并提供了一种概念验证方法,展示如何在运行时动态地控制模型行为。