Oct, 2023

危机匹配:用于细粒度灾害推文分类的半监督少样本学习

TL;DR社交媒体平台上关于自然灾害的实时信息在通知志愿者、应急管理人员和救援组织方面起到关键作用。然而,监测灾害事件的监督学习模型需要大量标注数据,使得其在实时灾害事件中难以实现。为了应对这一挑战,我们提出了一种在半监督少样本学习条件下的细粒度灾害推文分类模型,仅需小量标注数据。我们的模型 CrisisMatch 利用少量标注数据和大量无标注数据有效地将推文分类为感兴趣的细粒度类别,模拟灾害的早期阶段。通过集成有效的半监督学习方法和引入 TextMixUp,CrisisMatch 在两个灾害数据集上平均提升了 11.2% 的性能。此外,我们还对标注数据数量和领域外结果的影响进行了进一步分析。