概念瓶颈模型

ICMLJul, 2020

Concept Bottleneck Models

Pang Wei Koh, Thao Nguyen, Yew Siang Tang, Stephen Mussmann, Emma Pierson...

TL;DR通过在训练时预测概念并使用这些概念预测标签，概念瓶颈模型提供了对医学影像等领域高级概念的解释与干预，并允许更丰富的人机交互操作，从而实现了与标准的端到端分类器相当的分类准确性。

Abstract

We seek to learn models that we can interact with using high-level concepts: if the model did not think there was a bone spur in the x-ray, would it still predict severe arthritis? State-of-the-art models today do not typically support the manipulation of concepts like "the existence of bone spurs", as they are trained end-to-end to go directly from raw inpu

concept bottleneck models interpretation human-model interaction medical imaging classifier

发现论文，激发创造

通过概念瓶颈模型实现强大且可解释的医学图像分类器

通过使用自然语言概念，我们提出了一种建立强大而可解释的医学图像分类器的新范式，有效地解决了深度学习模型在医疗行业应用中学习虚假相关性而不是期望特征以及缺乏可解释性的问题。

Oct, 2023

概念瓶颈模型是否学习预期所得？

研究发现概念瓶颈模型很难满足解释性、可预测性和干预性三个目标，使用事后可解释性方法证明概念与输入空间中任何语义上有意义的东西都不对应，因此质疑概念瓶颈模型在目前形式下的实用性。

May, 2021

我看到了，我构思了，我得出了结论：渐进式概念作为瓶颈

本文介绍一种层次化概念瓶颈模型用于质量评估胎儿超声扫描图像，并在验证中得出了该模型在预测性能上的优势，并探讨了专家干预对提高预测性能的实际作用。

Nov, 2022

瓶颈模型中的跨模式概念化

通过跨模态学习方法，我们在训练中使用文本描述来指导概念的引入，以产生可解释的概念，提高模型的健壮性。

Oct, 2023

概念嵌入模型：超越准确性和可解释性的平衡

该研究提出了一种新的概念限制模型 —— 概念嵌入模型，学习解释性高维概念表示，支持人类干预和提高模型性能，这是一个在真实世界条件下优化准确性、鲁棒性和解释能力之间权衡的方案。

Sep, 2022

我们能约束概念瓶颈模型学习语义有意义的输入特征吗？

概念瓶颈模型是一种具有内在可解释性的模型，本文研究了如何通过细粒度概念注释的数据集学习概念，并通过移除问题概念相关性来实现概念与输入特征之间的语义映射，通过引入基于纸牌领域的合成图像数据集作为未来研究的基准，以及在胸部 X 光数据集上的实证研究来验证概念在实际应用中的可学习性。

Feb, 2024

随机概念瓶颈模型

通过建模概念间的依赖关系并引入分布参数化，提出了一种基于概念瓶颈模型的新方法，通过影响相关概念来提高干预效果，并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据，同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性，减少了人工概念注释的需求。

Jun, 2024

可编辑的概念瓶颈模型

通过使用数学严谨的闭合形式近似和影响力函数，我们提出了可编辑的概念瓶颈模型（ECBMs），以解决从头重新训练的困境，实现高效率的数据删除和插入操作，从而适应大规模应用中的数据处理需求。

May, 2024

基于能量的概念瓶颈模型：预测、概念干预和条件解释的统一

我们提出了基于能量的概念瓶颈模型（ECBMs），通过使用一组神经网络定义候选（输入、概念、类别）元组的联合能量，以解决现有概念瓶颈模型存在的限制，提供更高的准确性和更丰富的概念解释。

Jan, 2024

学习乳腺超声病变检测的临床相关概念瓶颈

应用于乳腺超声图像中的人工智能模型具有潜在的减轻癌症负担的应用前景。本研究提出了一种能够解释其预测结果的可解释人工智能模型，并通过预测具有特定临床意义的乳腺影像学术语来方便放射科医师审查和纠正错误，从而提高癌症分类的性能。

Jun, 2024