Oct, 2023

通过迭代生成的概念瓶颈实现可解释性的文本分类

TL;DR提出一种名为 Text Bottleneck Models(TBMs)的可解释性文本分类框架,通过使用 Large Language Model(LLM)自动发现和测量一组显著概念,并利用线性层将这些概念值用于最终预测,从而在高风险领域中提供全局和局部解释,进而在广泛文本领域中提高解释性能。