Jul, 2024

重新考虑用于神经机器翻译的定向对抗攻击

TL;DR该论文首次发现了现有NMT定向对抗攻击设置中的关键问题,并提出了一种可靠的NMT定向对抗攻击新设置。基于该新设置,本文提出了一种称为TWGA方法的定向词梯度对抗攻击方法,证明所提出的设置能够提供准确的攻击结果,并且该方法能够有效攻击受害的NMT系统。对大规模数据集的详细分析进一步揭示了一些有价值的发现。