Mar, 2018
印度英语混合编码数据的攻击注释语料库
Aggression-annotated Corpus of Hindi-English Code-mixed Data
Ritesh Kumar, Aishwarya N. Reganti, Akshit Bhatia, Tushar Maheshwari
TL;DR为了防止网络暴力和仇恨言论,本文通过对两个印度最流行的社交媒体平台 Twitter 和 Facebook 上的印地语 - 英语代码混合数据进行注释,开发出一套攻击标签集和注释语料库,以进行进一步的研究和防范。