利用 Twitter 数据确定飓风等级:一项实验
该研究介绍了 HurricaneEmo 情感数据集,其中包含 15,000 条带有情感的英文推文,覆盖了三个飓风: Harvey,Irma 和 Maria,并探讨了利用社交媒体平台分析灾难领域情感的挑战和价值。
Apr, 2020
该论文主要研究社交媒体在灾难和紧急情况下作为信息来源的潜力和挑战,并提出了一种基于文本分类的框架来处理 Twitter 噪声数据,通过使用多个 transformers 模型最终达到了 F1-score 0.87 的高分数。
Jan, 2023
本文通过弱监督学习建立高质量的社交媒体紧急信息分类器,使用 Twitter 上的微博信息以及事件关键词帮助快速生成高质量的标签化数据,利用前续信息和回复信息来丰富微博表示方法以处理嘈杂短小的用户生成信息,且仅需 1-2 人时的人工监督即可在两次飓风期间实现优于需要 50 人时手动标注的管理分类器。
Oct, 2020
本文介绍了如何构建一个基于在线社交网络的分类器来筛选有关地震的推文,以减少公众在自然灾害时获取相关信息的难度。通过使用 2010 年智利地震的数据集,作者们研究了类不平衡和维度降低等变量对 5 种分类器的影响,为构建类似系统提供了重要的参考和建议。
Mar, 2015
本文研究了在灾难中使用社交媒体如 Twitter 等传播信息以提高灾难控制。当前流行的通过学习的方法无法很好地识别与灾难相关的推文,因此我们提出了一种基于匹配关键词和标签的简单而有效的算法。结果表明,我们的方法提供了更高质量和更可解释的情绪分析任务相关的推文,是一种可行的方法。
May, 2017
本文提出了一种利用语义嵌入和无监督学习的方法,在社交媒体的帖子数据集中对于重大自然灾害的子事件进行识别,并对其进行分析和分类。通过对两组数据集进行实验证明了该方法的有效性和优越性。
Dec, 2019
灾害管理是一个极具潜力的研究领域,因为它对经济、环境和社会产生了重大影响。本研究重点分析与灾害管理相关的各种数据(卫星图像和推特数据),以深入分析按地理位置分组的紧急需求。通过两个阶段的研究,分别是卫星图像分析和推特数据分析,最后利用位置进行整合。利用基于 U-Net 架构的多类土地覆盖分割技术对地点进行灾后卫星图像分析是第一个阶段。第二个阶段侧重于为救援行动提供有关灾情和紧急需求的重要信息的地图绘制。通过使用与该地点相关的关键词,筛选出严重受灾地区,并提取推特数据。通过基于内容词的推特摘要(COWTS)技术从大量原始推特中提取情境信息。将这些模块实时整合,利用基于位置的地图绘制和频率分析技术,在发生灾害的情况下收集多维信息,例如对喀拉拉邦和密西西比州洪水进行了测试和验证。本研究的创新之处在于应用分割的卫星图像进行灾害救援,通过突出土地覆盖变化,并通过地区特定的筛选器整合推特数据,获取灾害的完整概览。
Nov, 2023
本文介绍了使用弱监督创建标记数据集以训练机器学习模型来识别三种不同类型的自然灾害的方法,其表现优于人工标注的金标准数据集,并公开了数据集以供科研社区使用。
Jul, 2022
本文提出一种基于深度学习模型和人类标注的新型大规模社交媒体数据集,用于自然灾害期间信息分类和简洁归纳, 以改善现有数据集的局限性,提高分类准确度。
Apr, 2021
通过收集自然灾害期间 Twitter 上的大量多模态数据集,为人道主义组织提供了有用的三种注释类型以解决危机响应和管理任务,特别关注社交媒体上的图像内容在减灾救灾中的作用。
May, 2018