通过特征交互检测在文本分类上生成层次化解释

ACLApr, 2020

通过特征交互检测在文本分类上生成层次化解释

Generating Hierarchical Explanations on Text Classification via Feature Interaction Detection

Hanjie Chen, Guangtao Zheng, Yangfeng Ji

TL;DR提出了一种新方法，即检测特征交互来构建分层解释，从而可视化不同层级中单词和短语的组合方式，帮助用户理解黑匣子模型的决策过程，并在 LSTMs、CNNs 和 BERTs 三个神经文本分类器的两个基准数据集上进行了评估，通过自动和人工评估实验证明此方法提供的解释既忠实于模型，又易于解释。

Abstract

Generating explanations for neural networks has become crucial for their applications in real-world with respect to reliability and trustworthiness. In →

neural networks explanations natural language processing feature interactions interpretable

发现论文，激发创造

神经文本分类的分层解释

本文提出了一种新的 Hierarchical INTerpretable 神经文本分类器 Hint，它可以自动生成按标签关联的话题的模型预测解释，实验结果表明 Hint 方法在文本分类方面不仅与现有的最先进的文本分类器相当，而且生成的解释比其他可解释的神经文本分类器更符合模型预测，并且更易于被人类理解。

Feb, 2022

学习的视觉特征到文本解释

利用大型语言模型解释视觉模型的学习特征，通过训练神经网络建立图像分类器和语言模型之间的连接，生成大量的句子来解释分类器学习到的特征，并提取最频繁的词语，增强图像分类器的解释性和鲁棒性。

Sep, 2023

面向文本分类的显式交互模型

介绍了一种新的基于交互机制的文本分类框架，利用单词级别的匹配信号来提升 Deep Neural Networks 在文本分类中的表现。实验结果表明，该方法在多 Label 和多类别文本分类任务中表现优异，并发布了相关代码和参数。

Nov, 2018

特征交互可解释性：通过神经交互检测解释广告推荐系统

该研究提出了一种解释和增强黑盒推荐系统预测的方法，可以在不假设推荐系统结构的情况下使用，并且能够提供新的领域洞察，例如文本和图像分类。实验结果表明，该方法在广告点击预测方面的解释和预测性能显著优于现有的推荐模型。

Jun, 2020

基于人工标注的文本分类解释方法评估

本文探讨了一些适用于 CNN 文本分类的模型无关和模型特定解释方法，并进行了三次人类评估来揭示这些方法揭示模型行为、证明模型预测和帮助人类调查不确定预测的不同效果。结果表明，这些方法具有不同的性质，并且可以为每个目的提供帮助。

Aug, 2019

在文本分类中生成分层解释且不需连接规则

本文提出了一种不需要连接规则的层次化解释生成框架，可以用于生成单词的层次式聚类，以提供高质量的解释，并反映模型决策过程。

Oct, 2022

用于解释模型预测的非对称特征交互

提出了一种基于深度神经网络的自然语言处理模型的非对称特征交互解释模型，利用有向交互图表示解释，实验结果表明该模型在情感分类数据集上识别有影响的特征方面表现优异。

May, 2023

输入特征归因分析的统一框架

机器学习模型的决策过程解释对于确保其可靠性和公平性至关重要。我们提出了一个统一框架，通过四个诊断属性实现了突出和交互式解释的直接比较，并揭示了不同诊断属性方面各解释类型的优势。突出解释对模型预测最为忠实，而交互式解释对于学习模拟模型预测提供了更好的效用，这些认识进一步凸显了未来研究发展结合方法以提高所有诊断属性的需求。

Jun, 2024

解释解释：深度网络的公理特征交互

本研究介绍了 Integrated Hessians，这是 Integrated Gradients 的扩展，用于解释神经网络中的成对特征交互；与以前的方法相比，Integrated Hessians 具有更快的速度和更好的性能，适用于各种神经网络架构或类别。

Feb, 2020

为推荐系统检测有效特征交互

利用图神经网络方法和基于 L0 激活正则化的边缘预测技术，自动检测有益于提升推荐准确性的特征交互作用，取得了比现有方法更好的准确性表现。

Aug, 2020