BriefGPT.xyz
Jun, 2018
xGEMs: 生成范例以解释黑盒模型
xGEMs: Generating Examplars to Explain Black-Box Models
HTML
PDF
Shalmali Joshi, Oluwasanmi Koyejo, Been Kim, Joydeep Ghosh
TL;DR
该研究提出了xGEMs框架,通过探索底层数据流形的景观,将黑盒分类器的行为进行了深入理解。它采用无监督的隐式生成模型来训练数据流形的代理。通过扰动沿流形的数据样本来定量总结黑盒模型行为。展示了xGEMs在检测和量化模型学习中的偏差,以及在理解模型行为随着训练进展而发生的变化方面的能力。
Abstract
This work proposes
xgems
or
manifold guided exemplars
, a framework to understand
black-box classifier
behavior by exploring the landscape
→