Dec, 2020

通过极简对比编辑(MiCE)解释 NLP 模型

TL;DR该论文介绍了一种基于最小对比编辑(MiCE)的方法,用于以编辑输入的形式产生模型预测的对比解释,以修改模型输出到对比案例。MiCE 不仅是对比的,还是最小的和流利的,与人类对比编辑一致。该方法可以用于 NLP 系统开发中的两种用例:调试错误的模型输出和揭示数据集人工因素,从而表明产生对比解释是模型解释性的一个有前途的研究方向。