Jul, 2024

自然语言逆事实生成综述

TL;DR自然语言对抗生成旨在最小程度地修改给定文本,使得修改后的文本将被分类为不同的类别。生成的对抗性示例提供了有关模型预测背后的推理过程的见解,通过突出显示哪些单词对结果有重要影响。此外,它们可用于检测模型的公平性问题或增强训练数据以提高模型的强健性。已进行了大量针对各种自然语言处理任务的对抗生成研究,采用了不同的模型和方法。由于这个领域的快速增长,系统综述对于指导未来的研究者和开发者至关重要。为了弥补这一空白,本综述全面概述了文本对抗生成方法,特别是基于大型语言模型的方法。我们提出了一个新的分类法将生成方法分为四组,并系统总结了评估生成质量的度量标准。最后,我们讨论了正在进行的研究挑战,并勾勒出未来工作的有前景的方向。