Nov, 2020

请勿居高临下!一个带有针对弱势群体的居高临下和蔑视性言语的批注数据集

TL;DR本论文介绍了一个新的注释数据集,旨在支持开发 NLP 模型以识别和分类针对弱势群体(如难民,无家可归者,贫穷家庭)的含有愚弄或屈辱意味的语言,通过对该数据集的分析,我们发现对标准 NLP 模型来说,识别针对弱势群体的屈辱言词是有挑战的,并且 BERT 语言模型在该任务上取得了最好的结果。