AAAIDec, 2018
NeuroX: 用于分析神经网络中个体神经元的工具包
NeuroX: A Toolkit for Analyzing Individual Neurons in Neural Networks
Fahim Dalvi, Avery Nortonsmith, D. Anthony Bau, Yonatan Belinkov, Hassan Sajjad...
TL;DR提供一款工具箱以便于神经网络模型的解释和理解,为用户提供了几种方法来识别与模型本身或外部任务相关的显著神经元,用户可以可视化选择的神经元,删除它们来测量它们对模型准确性的影响,并操纵它们来控制模型在测试时的行为。