Jun, 2018

xGEMs: 生成范例以解释黑盒模型

TL;DR该研究提出了xGEMs框架,通过探索底层数据流形的景观,将黑盒分类器的行为进行了深入理解。它采用无监督的隐式生成模型来训练数据流形的代理。通过扰动沿流形的数据样本来定量总结黑盒模型行为。展示了xGEMs在检测和量化模型学习中的偏差,以及在理解模型行为随着训练进展而发生的变化方面的能力。