语言 Transformer 中的解码器层显著性解读

Aug, 2023

语言 Transformer 中的解码器层显著性解读

Decoding Layer Saliency in Language Transformers

Elizabeth M. Hou, Gregory Castanon

TL;DR我们介绍了一种在应用于分类任务的大规模语言模型中识别文本显著性的策略。我们采用了渐变基础的显著性方法，并提出了一种评估每一层语义一致性程度的方法，在多个基准分类数据集上展示了相对于其他方法的一致性改进。我们的方法不需要额外的训练或标记数据，并且在计算效率上具有相对优势。

Abstract

In this paper, we introduce a strategy for identifying textual saliency in large-scale language models applied to classification tasks. In visual networks where saliency is more well-studied, saliency is naturall

textual saliency large-scale language models convolutional layers transformer-stack networks semantic coherence

发现论文，激发创造

基于上下文编码器 - 解码器网络的视觉显著性预测

该论文提出了一种基于卷积神经网络的方法，通过提取多尺度的高级视觉特征和上下文信息，结合全局场景信息，用于准确预测视觉显著性，可以适用于资源受限的应用，如（虚拟）机器人系统，从而在多个基准测试数据集上取得了有竞争力和一致的结果。

Feb, 2019

在时间序列预测中进行深度学习可解释性基准测试

本篇论文研究了基于 saliency 的可解释性方法在时间序列数据上的应用，提出并比较了多种 saliency 方法在不同神经网络结构上的性能，并提出多种指标进行评估，发现常规的网络结构和 saliency 方法难以可靠和精确地识别时间序列数据中特征的重要性，这主要是由于时间和特征领域的混淆所导致的，但使用文中提出的两步形式的时间 saliency rescaling 方法可以显著提高 saliency 图的质量。

Oct, 2020

来自注视的学习醒目度

基于变压器模型的 Saliency TRansformer 方法通过利用变压器中的并行解码，仅从注视地图中学习显著性，并将显著性预测视为一种直接的集合预测问题，通过一种全局损失来预测唯一的注视点，并在 Salicon 和 MIT300 基准测试中取得与最先进方法相当的度量分数。

Nov, 2023

评估神经语言模型的显著性方法

本文通过对 NLP 模型的神经语言进行全面的定量评估，从两个方面评价了预测解释的质量：可信度和可信度。通过评估，我们发现，如何在给定相同模型和预测时，不同的显着性方法经常在解释上产生分歧。作者建议部署此类方法到神经语言模型的未来工作，应该在得出结果之前仔细验证其解释。

Apr, 2021

超越注意力可视化的 Transformer 可解释性

本研究提出了一种基于 Deep Taylor Decomposition 原则的计算 Transformer 网络相关性的方法，通过注意力层和跳跃连接进行传播，并通过基于图像分类和文本分类问题的测试表明其在解释性方面优于现有方法。

Dec, 2020

基于显著性引导训练的深度学习解释性改进

本文介绍了一种基于显著性引导培训的神经网络方法，可以有效降低噪声导致的特征归因不准确，并通过实验表明这种方法能够在保持预测性能的同时提高模型可解释性。

Nov, 2021

一种深层多级网络用于显著性预测

本研究提出了一种新颖的深度架构用于显著性预测，通过整合卷积神经网络的不同层级的特征图、学习高低层级特征图的权重和使用先验学习网络来优化模型，使其在目前最大的公共数据集 SALICON 上表现优异且在 MIT300 基准测试中取得竞争性结果。

Sep, 2016

基于标题引导的自上而下视觉显著性

本文提出了基于标题引导的视觉显著性方法，通过训练数据隐式的学习到现代编码器解码器网络中的区域到单词的映射，而不引入显式的注意力层，从而分析各种现有模型结构，并提供更准确的显著性热图。

Dec, 2016

自然语言多任务：分析和提高隐藏表示的句法显著性

训练多任务自动编码器进行语言任务，分析学习到的句子隐藏表示。加入翻译和词性解码器时，表示将显着改变。使用的解码器越多，模型根据句法相似性对句子进行聚类的效果越好。通过插值句子来探索表示空间的结构，得出很多有可识别句法结构的伪英语句子。最后，我们指出了模型的一个有意思的特性：两个句子之间的差分向量可以添加到第三个具有类似特征的句子中，以有意义的方式改变它。

Jan, 2018

深度视觉显著性模型的理解与可视化

通过分析深度显著性模型中间层个体神经元学习的特征表示，研究表明：一些视觉区域已经预先编码在对象识别的网络的各个层中，预先训练模型 fine-tuning 以进行显著性预测会使它们偏爱某些类别，在自然图像上，深层显著性模型胜于传统模型，但在人造刺激上表现反其道而行之。

Mar, 2019