Dec, 2016

通过表示擦除理解神经网络

TL;DR本文提出了一种使用擦除来解释神经模型决策的通用方法,通过分析和比较擦除输入词向量的不同部分,中间隐藏层的不同单元或输入词的不同方法,来评估和解释模型判断的影响。研究表明,该方法不仅可以提供清晰的神经模型决策解释,还可以为神经模型的错误分析提供一种方法。