Sep, 2023

语言模型作为反事实解释模块:ChatGPT 能否解释黑盒文本分类器?

TL;DR使用大型语言模型作为反事实解释模块,通过提取潜在特征生成可解释黑盒文本分类器的决策的对策性解释。通过评估多个具体度的框架变体,显示了在不同设置下这些模型的性能差异,其中一种基于两步特征提取的变体在大多数情况下表现最好。该流程可用于自动解释系统,潜在地减少人工工作量。