Mar, 2022

基于预训练语言模型检测社交媒体评论中的恐同和恐Trans现象

TL;DR本文介绍了我们基于转换器模型的LT-EDI共享任务中用于检测社交媒体评论中的恐同和仇视跨性别内容的系统,使用mBERT等模型,并通过数据增强技术处理类别不平衡问题,代码已开源。在英语、泰米尔语和泰米尔语-英语子任务中,我们的排名分别为9、6、3,宏平均F1得分为0.42、0.64和0.58。