AAAIDec, 2023

神经排序模型的扰动不变对抗训练:改进有效性 - 鲁棒性权衡

TL;DR使用对抗性例子的神经排序模型(NRMs)在信息检索(IR)中取得了巨大的成功,但是可以通过添加不可察觉的扰动来操纵它们的预测结果。本研究通过将对抗性例子融入训练数据,建立了关于 NRMs 中效果和鲁棒性的权衡的理论保证,并设计了一种新的具有扰动不变性的对抗训练(PIAT)方法,以实现更好的效果和鲁棒性的权衡。实验结果表明,PITA 在多个排序模型上相对于现有的对抗防御方法具有优越性。