Nov, 2020

印地语敌对检测数据集

TL;DR本文提出了一个新颖的基于印地语的敌对性检测数据集,其中包括约 8200 个在线发布的文本,覆盖了虚假新闻、仇恨言论、攻击性和诽谤帖子等四个维度,并采用多标签标注方式,发布该数据集作为 CONSTRAINT-2021 敌对性帖子检测任务的一部分。