Apr, 2024

一种通用的讽刺检测方法即将到来,当然!

TL;DR对四个具有不同讽刺特征的讽刺数据集进行精调的讽刺检测模型的鲁棒性进行了测试,结果发现使用第三方标签进行精调的模型在内部数据集预测中表现更好,而大多数模型在跨数据集预测中无法很好地进行泛化,暗示一个数据集类型无法代表不同风格和领域的所有种类的讽刺。与现有数据集相比,本研究发布的新数据集上精调的模型在与其他数据集的泛化性能上表现最好。通过手动检查数据集和事后分析,我们发现泛化困难的原因在于讽刺实际上存在不同的领域和风格。我们认为未来的讽刺研究应考虑讽刺的广泛范围。