Feb, 2017
欺骗 Google 旨在检测有害评论的透视 API
Deceiving Google's Perspective API Built for Detecting Toxic Comments
Hossein Hosseini, Sreeram Kannan, Baosen Zhang, Radha Poovendran
TL;DR本文提出了一种基于对抗样例的攻击方法,针对 Google 和 Jigsaw 的机器学习项目 Perspective 中的有害语言检测系统,通过对高毒性短语的微小修改降低系统对其的有害等级,揭示了这类攻击方法的危害性和有害检测系统的可靠性问题。