ACLMay, 2023

针对神经排序模型的几乎不可察觉的文档篡改

TL;DR本研究提出了一种名为 Imperceptible DocumEnt Manipulation (IDEM) 的框架,该框架可以生成对算法和人类来说更难察觉的对抗性文档,并通过在不引入易于检测错误的情况下指导已建立的生成语言模型(例如 BART)生成连接语句,同时采用分离的位置合并策略来平衡扰动文本的相关性和一致性。实验结果表明,IDEM 可以在保持目标文档的流畅性和正确性的同时,胜过强的基准,并且将对抗文本生成与替代 NRM 的分离使 IDEM 更加强健,不受替代 NRM 质量的影响。