Jul, 2024

探寻内在原因:为何LLMs产生幻觉的因果视角

TL;DR通过干预大型语言模型(LLMs)的自注意力层,我们发现在LLMs的前部或尾部禁用特定的自注意力层可以减轻幻觉问题,从而为理解和减轻LLMs的幻觉问题打开了一条新的途径。