ICLRJun, 2018

神经网络预测的分层解释

TL;DR引入聚合上下文分解的方法来解释 DNN 预测结果。该方法通过产生输入特征的层次聚类以及每个聚类对于最终预测的贡献,实现了对 DNN 的预测结果进行解释,有效诊断不正确的预测和识别数据集的偏倚。同时人体实验也表明,ACD 能够使用户较好地识别两个 DNN 中更准确的那一个,并更加信任 DNN 的输出。