解释、预测，再次预测

WSDMJan, 2021

Explain and Predict, and then Predict Again

Zijian Zhang, Koustav Rudra, Avishek Anand

TL;DR本文介绍了一种名为 ExPred 的新方法，采用多任务学习的方法，在任务输入的解释生成阶段有效地平衡了解释和预测的损失，并使用另一个预测网络来优化任务性能。在三个不同的语言数据集上进行了广泛的评估，发现我们明显优于现有方法。

Abstract

A desirable property of learning systems is to be both effective and interpretable. Towards this goal, recent models have been proposed that first generate an extractive explanation from the input text and then generate a prediction on just the explanation called explain-then-predict models

explain-then-predict models rationales data multi-task learning fact verification sentiment classification

发现论文，激发创造

EDUCE: 通过无监督概念提取解释模型决策

本文提出一种新的自我解释模型，通过低维度二进制表示预测结果并提供输入概念存在的解释，自动定义相关概念，实现易解释性，实验结果表明模型在文本分类和情感分析任务中具有较好的表现。

May, 2019

面向可解释性自然语言处理：文本分类的生成式解释框架

本文提出了一个新的生成式解释框架，学习同时进行分类决策和生成细粒度解释，实验证明该方法可以生成简明的解释，超过所有基线系统。

Nov, 2018

重新思考用户研究设计以评估模型解释

该研究通过一个众包实验，探讨解释机器学习模型的预测对人类是否具有帮助，并发现在给定特征系数的情况下，人们能够更有效地对线性词袋模型进行操纵，但解释对 BERT 型分类器并没有显著提高操纵能力，而通过伪造 BERT 模型的线性模型的对全局归属的解释则可以有效地操作 BERT 型模型。

Dec, 2021

利用解释作为潜在变量实现可解释的自然语言理解

本文提出了一种可解释自然语言理解的框架，使用一小部分人类注释的解释进行训练，并采用变分 EM 方法进行优化，同时提出了基于解释的自训练方法，在两个自然语言理解任务上进行实验，证明了该框架不仅可以在监督和半监督设置下进行有效的预测，还可以生成良好的自然语言解释。

Oct, 2020

基于知识的自我合理化：通过抽取和自然语言解释

介绍了一种自我合理化的框架 RExC，旨在提供两种互补类型的解释（NLE 和提取合理），并将其与背景知识结合起来，从而达到了任务最新水平的性能，并大幅度领先于现有模型，同时进行干扰分析表明，解释与预测之间存在高度的关联性。

Jun, 2021

模型何时能从解释中学习？理解解释数据的角色的正式框架

这篇论文研究了解释数据对于模型效能的影响，利用回收法证明了推理为主的文本输入任务中，解释数据可用作模型输入，且采用检索式的建模方法可以使合成任务的准确率达到 95%，而无解释数据的基线准确率低于 65%。

Feb, 2021

通过半监督蕴涵信号实现合理提取的理由化

通过在部分监督下基于自然语言推理模型对合理性解释模型进行了优化，无需访问真实标签，提高了性能，并实现了与监督提取模型相当的结果和优于无监督方法 100% 以上的性能。

Feb, 2024

WT5?! 训练文本对文本模型解释其预测

本文使用文本到文本的框架，训练语言模型在生成自然文本预测的同时输出自然文本解释，实现了在可解释性基准测试上的最先进结果，并且允许跨数据集传递来自有限数量标记解释的理解能力。

Apr, 2020

推荐系统中的文本解释和评价

本篇论文探讨了在自然语言处理和推荐任务中推断高质量执行操作和使解释具有可操作性的两个基本挑战，并通过证明解释性不以在两个应用中展示的卓越表现为代价的框架将人工智能应用实践的承诺变为现实。

May, 2022

FiD-Ex: 改进序列到序列模型以进行摘要理由生成

本文介绍一种名为 FiD-Ex 的模型，它采用序列到序列的结构，通过引入句子标记、融合解码器结构和中间微调等方法来解决 Seq2Seq 模型中的问题，显著提高了模型的解释效果和准确性。

Dec, 2020