卷积神经网络单元中自然语言概念的发现

ICLRFeb, 2019

卷积神经网络单元中自然语言概念的发现

Discovery of Natural Language Concepts in Individual Units of CNNs

Seil Na, Yo Joong Choe, Dong-Hyun Lee, Gunhee Kim

TL;DR本文尝试理解深度卷积神经网络对自然语言任务训练时的表示方式，发现其各个单元对特定词素、单词和短语具有选择性响应，而非对任意难以解释的模式响应。作者提出了基于复制文本单位响应的概念对齐方法，对多个数据集的分类和翻译任务进行了定量分析，并为我们深入理解深度模型如何理解自然语言提供了新思路。

Abstract

Although deep convolutional networks have achieved improved performance in many natural language tasks, they have been treated as black boxes because they are difficult to interpret. Especially, little is known a

deep convolutional networks language tasks morphemes concept alignment method natural language understanding

发现论文，激发创造

深度神经网络中个体单元的作用理解

本文介绍了一个分析框架 —— 网络分解，通过该框架系统地识别图像分类和图像生成网络中单个隐藏单元的语义，作者使用该框架分析卷积神经网络和生成对抗网络模型并应用于理解对抗攻击和语义图像编辑。

Sep, 2020

使用字符感知神经网络进行词级别预测：它们是否发现语言规则？

本文研究字符级别模式识别神经网络所学习的规律以及相对于手动标注的词语分割的重叠性，并使用卷积神经网络和双向长短期记忆网络对三种不同的语言进行形态标记任务的评估和比较，证明这些模型可以隐式地发现可理解的语言规则。

Aug, 2018

通过引导概念学习实现可理解的卷积神经网络

该论文提出了一种带有附加概念层的 CNN 架构的引导学习方法，用于学习视觉特征和单词短语之间的关联，并通过优化预测准确性和特征表示的语义来学习与人类感知一致的概念，实验结果表明，所提出的模型可以在不牺牲准确性的情况下学习一致于人类感知的概念，并可将这些学习到的概念转移到具有相似概念的新对象类别中。

Jan, 2021

基于卷积神经网络的图像字幕语言的实证研究

本研究介绍了一种基于卷积神经网络的语言模型，适用于统计语言建模任务，在图像字幕生成中表现出竞争性能。相比以前的模型，它使用所有先前的单词进行训练，可以模拟历史单词的长期依赖性，这对图像字幕生成至关重要。该方法在 MS COCO 和 Flickr30K 两个数据集上进行了验证，实验结果显示，相较于基于循环神经网络的语言模型表现更佳，且具有竞争性的最先进技术。

Dec, 2016

卷积网络特征提取行为研究

该研究旨在探讨深度卷积神经网络中的各个特征的辨别力以及应用它们进行知识表示和推理的可能性，并通过统计学方法提供了新的见解和阈值方法来减少特征中的噪声。

Mar, 2017

网络解剖：量化深度视觉表示的可解释性

本研究提出了一种称为网络切片的通用框架，通过评估个体隐藏单元与一组语义概念之间的对齐来量化 CNN 的潜在表示的可解释性。该方法使用广泛的视觉概念数据集来评估中间卷积层中隐藏单元的语义。使用该方法测试单元的可解释性是否等同于单元的随机线性组合，然后将其应用于比较训练不同监督和自监督任务的各种网络的潜在表示。进一步分析了训练迭代的效果、比较了不同初始化的网络的效果、检查了网络深度和宽度的影响，并测量了深度视觉表示的可解释性的 dropout 和批标准化的影响。结果表明该方法能够揭示超出 CNN 模型和训练方法辨别能力之外的一些特征。

Apr, 2017

显式高层次概念在视觉到语言问题中有什么价值？

本文提出了一种将高层次的概念融入卷积神经网络和循环神经网络的方法，实现了在图像字幕生成和视觉问答的最新技术性能上的显着提升，并展示了通过引入外部语义信息来进一步提高性能。在此过程中，我们分析了高级语义信息在视觉到语言问题中的价值。

Jun, 2015

理解卷积神经网络在文本分类中的应用

本文研究了卷积神经网络在文本处理中的工作原理。作者发现，使用不同的神经元激活模式可以捕获不同的语义类别的 N-gram，并且 Max-pooling 操作可以区分出重要的 N-gram。最后，作者给出了基于研究结果的实际应用，包括模型可解释性和预测可解释性。

Sep, 2018

深度学习应用于自然语言处理

本文介绍了卷积神经网络（CNNs），其不同变体以及如何将其应用于自然语言处理（NLP）。

Mar, 2017

卷积神经网络架构匹配自然语言句子

本篇研究提出了一种卷积神经网络模型来匹配两个句子，并应用于不同语言和不同性质的匹配任务中，实验证明该模型表现出了良好的性能和比竞争模型更优的结果。

Mar, 2015