BriefGPT.xyz
Oct, 2021
通过隐式优化和 Shapley 引导搜索生成对抗样本
Text Counterfactuals via Latent Optimization and Shapley-Guided Search
HTML
PDF
Quintin Pope, Xiaoli Z. Fern
TL;DR
本文解决了生成对抗文本的问题,从而理解和调试分类器,通过优化潜在空间并利用语言模型生成候选修改来绕过离散性文本的优化难题,并使用 Shapley 值估计多个更改的组合效果来确保结果,结果显示潜在空间优化和使用 Shapley 值都显著提高了生成的反事实文本的成功率和质量。
Abstract
We study the problem of generating
counterfactual text
for a classifier as a means for understanding and debugging classification. Given a textual input and a
classification model
, we aim to minimally alter the t
→