Feb, 2021
通过交互重建评估生成模型的可解释性
Evaluating the Interpretability of Generative Models by Interactive Reconstruction
Andrew Slavin Ross, Nina Chen, Elisa Zhao Hang, Elena L. Glassman, Finale Doshi-Velez
TL;DR论文介绍了一种任务,用于量化生成模型的人类可解释性,该任务通过与用户交互修改表示来重构目标实例,在合成数据集上,我们发现此任务的表现比基线方法更可靠地区分纠缠和解缠模型,在真实数据集上,它区分了广泛认为但从未显示出产生更可解释模型的表示学习方法。