通过提取文本来生成短而连贯的理由 —— 根据规则确保足以做出准确预测的 —— 以代替不带理由的预测,该方法结合了生成器(分配文本碎片的候选理由)和编码器(用于预测)。从未给予判据,而是让模型符合对规则的要求。本文还在多方面情感分析和问题检索任务中成功验证了此方法。
Jun, 2016
本研究探讨了神经 NLP 模型的可解释性和鲁棒性之间的相互作用,试图通过有理化的过程来提高模型的鲁棒性,并针对五个不同的任务进行了实证评估。实验结果表明,理性模型有可能提高其鲁棒性,但它们在某些情况下会面临一定的挑战,并不总是表现得比无人为监督的模型更好。
Apr, 2022
研究如何使用先前经过训练的语言模型、神经知识模型和相关任务的远程监督等,通过训练生成解释原因的生成模型来推断自然语言解释。然而,结果表明,由于神经语言模型的基本限制,该模型生成的解释仅限于具有普遍性的陈述,而在进行推理的同时预测更新或其类型和生成理由是更具挑战性的,这是未来的重要方向。
Dec, 2020
文章分析了 2007-2022 年间自然语言处理领域合理化 (Rationalization) 技术的发展现状和存在的问题,提出了一种新的可解释人工智能技术领域 Rational AI (RAI) 并讨论未来的研究方向和挑战。
Jan, 2023
本文提出了一种多阶段培训方法,将自我监督对比损失纳入其中,并证明可以帮助生成更多语义多样的理性化解释,从而改善了啤酒评论数据集的实验结果,并解决了互锁问题。
May, 2022
本文提出基于两个辅助损失函数的方法,以更好地利用标签合理性远离的关键单词为目标 (PINs),并缓解非有用合理性的训练的冗余。两项代表性分类任务的实验表明,我们所提出的方法能够使分类模型有效地学习非完美 rationales 中关键的线索,同时保持将焦点扩展到其他重要未标记单词的能力,因此显著优于现有 methods。
Jun, 2021
利用自训练语言模型进行多任务教师 - 学生框架,在有限的任务特定标签和理由下,通过精心选择样本学习信息伪标签示例以及明确合理化预测的特征,显著提高了神经模型的性能,特别在低资源环境中表现出有效性。
Sep, 2021
提出一种自我解释模型 ConRAT,它从输入文本中提取概念,并使用关键概念的线性聚合来解释结果,以可解释性和预测性能方面超越了最先进的方法。
May, 2021
通过选择性理性化来提高神经网络可解释性,基于博弈论不变的理性化标准,对神经网络进行了解释,从而避免了虚假相关性,并使结果更易推广和符合人类判断。
Mar, 2020
本文研究了自然语言处理中的模型可解释性,提出了一种基于输入擦除的灵活的特征评分和解释方法,与传统方法相比,可以更准确地为每个数据实例选择最优的特征评分方法、解释长度和类型,以提供更准确、全面和充足的解释。
Apr, 2021