Nov, 2024

NMT-混淆攻击:用一个词忽略翻译中的一句话

TL;DR本研究针对神经机器翻译(NMT)模型的脆弱性,提出了一种新型的对抗攻击方法。研究者通过在两个句子之间插入一个词,使得第二个句子在翻译中被忽略,从而能够在实践中隐藏恶意信息。实验结果表明,超过50%的情况下,各种NMT模型对这种攻击都表现出脆弱性,且能维持较低的困惑度。