BriefGPT.xyz
Ask
alpha
关键词
induction heads
搜索结果 - 2
路径修补定位模型行为
本文介绍了一种名为 “路径修补” 的技术,通过该技术可以对神经网络的本地化行为进行量化测试,从而分析网络机制和可能的故障模式,并通过对 GPT-2 的行为进行表征来优化了归纳头的解释,并开源了一个运行类似实验的框架。
PDF
a year ago
上下文学习和归纳头
本文从六个方面提出了假设,指出 “感应头” 可能构成了大型变换器模型中大部分 “上下文学习” 的机制。同时,通过强因果证据和相关性证据,证明了这种感应头可能是任何大小的变压器模型中一般情况下上下文学习的来源。
PDF
2 years ago
Prev
Next