EMNLPNov, 2022
针对不公平 ToS 条款检测的攻击:一个使用通用对抗性触发器的案例研究
Attack on Unfair ToS Clause Detection: A Case Study using Universal Adversarial Triggers
Shanshan Xu, Irina Broda, Rashid Haddad, Marco Negrini, Matthias Grabmair
TL;DR本文研究证明基于 Transformer 的服务条款分析系统容易受到对抗攻击,微小的文本扰动可以显著降低检测性能。此外,人类评估研究表明触发器的自然性对欺骗读者至关重要。