May, 2024

本地交互基础:在神经网络中识别计算相关和稀疏交互特征

TL;DR通过将神经网络的激活转换为新的基础 - 局部互动基础(LIB),我们提出了一种新颖的可解释性方法,旨在识别计算特征,通过消除无关的激活和相互作用,以及基于它们对下游计算的重要性对特征进行缩放,生成显示模型中所有计算相关特征和相互作用的交互图。