神经理性模型的非理性

ACLOct, 2021

The Irrationality of Neural Rationale Models

Yiming Zheng, Serena Booth, Julie Shah, Yilun Zhou

TL;DR通过哲学角度和经验证据，本文提出神经理由模型的合理性和可解释性不如人们预期，并呼吁更加严密和全面的评估以确保达到所需的可解释性特性。

Abstract

neural rationale models are popular for interpretable predictions of nlp tasks. In these, a selector extracts segments of the input text,

neural rationale models nlp interpretability selector classifier

发现论文，激发创造

神经预测的理性化

通过提取文本来生成短而连贯的理由 —— 根据规则确保足以做出准确预测的 —— 以代替不带理由的预测，该方法结合了生成器（分配文本碎片的候选理由）和编码器（用于预测）。从未给予判据，而是让模型符合对规则的要求。本文还在多方面情感分析和问题检索任务中成功验证了此方法。

Jun, 2016

理性化是否能提高稳健性？

本研究探讨了神经 NLP 模型的可解释性和鲁棒性之间的相互作用，试图通过有理化的过程来提高模型的鲁棒性，并针对五个不同的任务进行了实证评估。实验结果表明，理性模型有可能提高其鲁棒性，但它们在某些情况下会面临一定的挑战，并不总是表现得比无人为监督的模型更好。

Apr, 2022

远程监督下非单调推理的理性化学习

研究如何使用先前经过训练的语言模型、神经知识模型和相关任务的远程监督等，通过训练生成解释原因的生成模型来推断自然语言解释。然而，结果表明，由于神经语言模型的基本限制，该模型生成的解释仅限于具有普遍性的陈述，而在进行推理的同时预测更新或其类型和生成理由是更具挑战性的，这是未来的重要方向。

Dec, 2020

可解释 NLP 的合理化探索：一项调查

文章分析了 2007-2022 年间自然语言处理领域合理化 (Rationalization) 技术的发展现状和存在的问题，提出了一种新的可解释人工智能技术领域 Rational AI (RAI) 并讨论未来的研究方向和挑战。

Jan, 2023

无锁多方面文本分类理性化

本文提出了一种多阶段培训方法，将自我监督对比损失纳入其中，并证明可以帮助生成更多语义多样的理性化解释，从而改善了啤酒评论数据集的实验结果，并解决了互锁问题。

May, 2022

探索神经网络模型中的远程标记理由

本文提出基于两个辅助损失函数的方法，以更好地利用标签合理性远离的关键单词为目标 (PINs)，并缓解非有用合理性的训练的冗余。两项代表性分类任务的实验表明，我们所提出的方法能够使分类模型有效地学习非完美 rationales 中关键的线索，同时保持将焦点扩展到其他重要未标记单词的能力，因此显著优于现有 methods。

Jun, 2021

Few-shot 合理化自我训练：教师解释帮助学生进行 Few-shot NLU

利用自训练语言模型进行多任务教师 - 学生框架，在有限的任务特定标签和理由下，通过精心选择样本学习信息伪标签示例以及明确合理化预测的特征，显著提高了神经模型的性能，特别在低资源环境中表现出有效性。

Sep, 2021

理念的理性化

提出一种自我解释模型 ConRAT，它从输入文本中提取概念，并使用关键概念的线性聚合来解释结果，以可解释性和预测性能方面超越了最先进的方法。

May, 2021

不变量解释

通过选择性理性化来提高神经网络可解释性，基于博弈论不变的理性化标准，对神经网络进行了解释，从而避免了虚假相关性，并使结果更易推广和符合人类判断。

Mar, 2020

NLP 模型的灵活实例特定的理解

本文研究了自然语言处理中的模型可解释性，提出了一种基于输入擦除的灵活的特征评分和解释方法，与传统方法相比，可以更准确地为每个数据实例选择最优的特征评分方法、解释长度和类型，以提供更准确、全面和充足的解释。

Apr, 2021