Aug, 2024

灾害相关推文识别的主动学习:与关键词过滤和通用微调的比较

TL;DR本研究解决了在海量非结构化社交媒体数据中识别灾害相关推文的难题。通过比较关键词过滤、通用数据微调的RoBERTa模型以及主动学习(AL)训练的RoBERTa模型,发现结合通用微调和主动学习的模型在分类性能上表现最佳,显著降低了标注工作量。这一模型可广泛应用于灾害应对及社会媒体分析的相关研究中。