Oct, 2022

针对仇恨言论的 T5 增强数据和集成方法

TL;DR本研究使用不同最新模型对自动检测仇恨言论进行全面探究,发现数据增强和集成方法对模型有何优点,并使用两种可解释人工智能算法揭示模型如何做出预测。同时,发现缺乏数据注释和质量控制,提出了一个简单的机制用于纠正 T5 模型中的错误预测,并公开模型代码以提高研究透明度。