Sep, 2023
语言模型作为反事实解释模块:ChatGPT能否解释黑盒文本分类器?
LLMs as Counterfactual Explanation Modules: Can ChatGPT Explain
Black-box Text Classifiers?
TL;DR使用大型语言模型作为反事实解释模块,通过提取潜在特征生成可解释黑盒文本分类器的决策的对策性解释。通过评估多个具体度的框架变体,显示了在不同设置下这些模型的性能差异,其中一种基于两步特征提取的变体在大多数情况下表现最好。该流程可用于自动解释系统,潜在地减少人工工作量。