ICLRFeb, 2019

卷积神经网络单元中自然语言概念的发现

TL;DR本文尝试理解深度卷积神经网络对自然语言任务训练时的表示方式,发现其各个单元对特定词素、单词和短语具有选择性响应,而非对任意难以解释的模式响应。作者提出了基于复制文本单位响应的概念对齐方法,对多个数据集的分类和翻译任务进行了定量分析,并为我们深入理解深度模型如何理解自然语言提供了新思路。