Nov, 2024

文本分类器的反事实解释方法比较分析

TL;DR本文研究了反事实解释方法在文本分类器中的应用,针对五种方法进行了比较,发现传统的置换基础方法在生成有效反事实方面表现良好,而基于大型语言模型的新方法则在生成自然语言文本方面表现出色,但常常未能改变分类器的输出。研究建议结合这两类方法的优点,以开发新型高质量的反事实解释方法。