Jun, 2020

ETHOS:一个在线仇恨言论检测数据集

TL;DR在本文中,我们提出了基于YouTube和Reddit评论的文本数据集'EHTOS',并介绍了用于创建该数据集的注释协议,旨在平衡数据。我们的关键假设是,即使从这样耗时的过程中获得一小部分标记数据,我们也可以保证在所检查的材料中发现仇恨言论。