May, 2023

使用模型无关的方法解释仇恨言论分类

TL;DR本文研究了如何使用 BERT 模型和 LIME 算法来预测和解释仇恨言论,并提出了一种模型无关的解释方法,以支持系统的决策并防止模型偏差。