EMNLPNov, 2023

基于潜在特征的数据划分方法改善泛化评估:仇恨言论检测案例研究

TL;DR通过对现有数据集的新的训练 - 测试分割,我们挑战了仅基于目标和关键词训练、评估仅考虑训练和测试数据之间的分布变化的仇恨言论模型。我们提出了两种分割变体,并使用四个预训练模型应用于两个数据集,揭示了模型在潜在空间中的盲点上的灾难性失败。进一步分析表明,数据分割的表面级属性与性能下降之间没有明确的相关性,这突显了任务的难度不总是容易人类解释的。我们推荐在模型开发中加入基于潜在特征的分割,并通过 GenBench 基准发布了两种分割方案。