Sep, 2018
基于 N-gram 和 TFIDF 的机器学习方法在 Twitter 上检测仇恨言论和攻击性语言
Detecting Hate Speech and Offensive Language on Twitter using Machine Learning: An N-gram and TFIDF based Approach
Aditya Gaydhani, Vikrant Doma, Shrikant Kendre, Laxmi Bhagwat
TL;DR本文提出了一种利用机器学习方法,针对推特中的恶意信息、攻击性言论以及清晰文本进行分类的方法,并通过比较实验,得出了最高达 95.6% 准确率的分类模型,同时还开发了中间模块使用户可以方便地访问此工具。