NIPSNov, 2018

使用两阶段半监督方法检测开放领域对话中的攻击性内容

TL;DR本文提出了一个两步骤的半监督方法来从公共资源中引导大规模数据,以自动检测敏感语言,展示该方法在公共标注数据集和所提出的半监督数据集上显示出的优异表现和泛化能力,无需为敏感类别提供显式标签,从而在 Twitter 和 Toxic Wikipedia test 数据上实现了高达 95.5%的 F1 得分。