Feb, 2017

欺骗 Google 旨在检测有害评论的透视 API

TL;DR本文提出了一种基于对抗样例的攻击方法,针对 Google 和 Jigsaw 的机器学习项目 Perspective 中的有害语言检测系统,通过对高毒性短语的微小修改降低系统对其的有害等级,揭示了这类攻击方法的危害性和有害检测系统的可靠性问题。