通过迭代生成的概念瓶颈实现可解释性的文本分类

Oct, 2023

通过迭代生成的概念瓶颈实现可解释性的文本分类

Interpretable-by-Design Text Classification with Iteratively Generated Concept Bottleneck

Josh Magnus Ludan, Qing Lyu, Yue Yang, Liam Dugan, Mark Yatskar...

TL;DR提出一种名为 Text Bottleneck Models（TBMs）的可解释性文本分类框架，通过使用 Large Language Model（LLM）自动发现和测量一组显著概念，并利用线性层将这些概念值用于最终预测，从而在高风险领域中提供全局和局部解释，进而在广泛文本领域中提高解释性能。

Abstract

deep neural networks excel in text classification tasks, yet their application in high-stakes domains is hindered by their lack of interpretabili

deep neural networks text classification interpretability text bottleneck models large language model

发现论文，激发创造

瓶中之语：语言模型引导的概念瓶颈用于可解释的图像分类

本研究提出了一种基于 GPT-3 语言模型的 LaBo 方法来构建 Concept Bottleneck Models，LaBo 可以有效地搜索与给定问题领域相关的候选瓶颈概念，通过将 GPT-3 的句式概念与图像对齐形成瓶颈层，最终实验结果显示，LaBo 提高了 11.7% 的准确性，证明了解释性模型的广泛应用前景。

Nov, 2022

通过概念瓶颈模型实现强大且可解释的医学图像分类器

通过使用自然语言概念，我们提出了一种建立强大而可解释的医学图像分类器的新范式，有效地解决了深度学习模型在医疗行业应用中学习虚假相关性而不是期望特征以及缺乏可解释性的问题。

Oct, 2023

稀疏线性概念发现模型

通过对比性语言图像模型和单一稀疏线性层，我们提出了一个简单而直观的可解释框架，通过基于贝叶斯推理的数据驱动伯努利分布来实现框架中的稀疏性，相比相关方法，在准确性和每个样本概念稀疏性方面均表现出色，为新概念的个体研究提供便利。

Aug, 2023

通过概念瓶颈解读预训练语言模型

利用高层次、易于理解的概念来解释预训练语言模型的方法，通过人工标注和机器生成的概念来提取隐藏神经元，从而增强模型的鲁棒性和解释能力。

Nov, 2023

学习干预概念瓶颈

传统的深度学习模型缺乏解释性，概念瓶颈模型（CBMs）通过其概念表示提供内在解释。本文提出了概念瓶颈记忆模型（CB2M），通过两重记忆，CB2M 能够在新情境中学习推广干预，纠正模型的预测结果，从而自动改进模型性能。实验结果表明 CB2M 可以成功地推广到未见数据并识别错误的概念，是用户提供 CBM 互动反馈的一种有效工具。

Aug, 2023

概率性概念瓶颈模型

本研究中，我们提出了一种基于概率概念瓶颈模型（Probabilistic Concept Bottleneck Models，ProbCBM）的解释性模型，它可以通过建模概念预测的不确定性来提高可靠性和解释性。我们的方法不仅可以提供高水平的概念推导，还可以推断类不确定性。

Jun, 2023

事后概念瓶颈模型

本研究介绍后续概念瓶颈模型（PCBM），它可以将任何神经网络转换为具有解释性的概念瓶颈模型，无需在训练数据中密集注释概念，同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念，从而实现全局模型编辑。通过用户研究表明，通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下，显著提高性能。

May, 2022

稀疏概念瓶颈模型：对比学习中的 Gumbel 技巧

提出了一种使用概念瓶颈模型 (CBMs) 进行可解释分类的新架构和方法，该方法能够提供解读结果，通过引入称为概念瓶颈层的新类型层，训练 CBMs 取得了显著的准确度提升，并且通过概念矩阵搜索算法改进了复杂数据集上的预测结果。

Apr, 2024

阅读就是信仰：重新审视语言瓶颈模型对图像分类的作用

通过将现代图像描述器与预训练的语言模型相结合，语言瓶颈模型在灾害图像分类任务中能够超过黑盒模型的分类准确率，并且通过融合两者可以产生协同效应，进一步提高分类准确率。

Jun, 2024

分层概念发现模型：一个概念金字塔方案

利用深度学习算法设计了一种多层次概念发现框架，允许人类理解的概念在决策过程中高度解释性，通过图像 - 文本模型和基于数据驱动和稀疏的贝叶斯算法进行多层次概念选择，实验结果表明这种构建不仅胜过最近的 CBM 方法，而且为解释性提供了一个有原则的框架。

Oct, 2023