ACLMay, 2021
深度自然语言处理模型中的细粒度解释和因果分析
Fine-grained Interpretation and Causation Analysis in Deep NLP Models
Hassan Sajjad, Narine Kokhlikyan, Fahim Dalvi, Nadir Durrani
TL;DR本文介绍了深度 NLP 模型中的细粒度解释和因果分析,包括如何分析单个神经元和神经元组,输入特征的作用以及如何应用这种神经元分析技术,如网络操作和域适配。同时,本文介绍了两个工具包:NeuroX 和 Captum。