EMNLPNov, 2022

针对不公平 ToS 条款检测的攻击:一个使用通用对抗性触发器的案例研究

TL;DR本文研究证明基于 Transformer 的服务条款分析系统容易受到对抗攻击,微小的文本扰动可以显著降低检测性能。此外,人类评估研究表明触发器的自然性对欺骗读者至关重要。