社交媒体和自然语言处理在自然灾害研究中的应用
TweetNLP 是一个支持社交媒体中自然语言处理任务(包括情感分析、实体识别、表情预测和辱骂识别)的综合平台,其采用基于 Transformer 的语言模型,专门用于处理社交媒体文本,提供 Python 库、在线演示和教程等多种支持。
Jun, 2022
本研究对 19 种不同危机期间收集的 Twitter 语料库进行了人工标注并训练了机器学习分类器,此外还发布了在 5200 万条危机相关 Tweets 上训练的第一大 word2vec word embeddings,以应对消息的语言问题,提出了不同词汇变体的人工标注规范资源。
May, 2016
机器学习和自然语言处理可以通过预测实时的恐怖袭击来帮助打击恐怖主义,本研究通过使用社交网络文本来提取必要信息建立合适的恐怖袭击预测数据集,实验发现现有解决方案在地点识别方面准确率较低,我们的解决方案得以解决,并将扩展解决方案以提取日期和行动信息来实现项目目标。
Aug, 2023
本文讨论了对于不规则、嘈杂、依赖上下文及动态性的推文(一种微博形式),运用自然语言处理技术进行挖掘和智能信息访问的挑战,重点关注了从推文中提取实体并进行实体消歧的任务,介绍了一个新的 Twitter 实体消歧数据集,并对多个最先进的 Named Entity Recognition & Disambiguation 模型进行了实证分析。
Oct, 2014
在这篇论文中,我们提出了一个三步解决方案,旨在充分利用社交媒体内容和自然语言处理技术,实现灾害信息学中的相关分类、地点提取和主题建模,以应对社交媒体内容中的挑战。
May, 2024
TweeNLP 是一个集合 Twitter 自然语言处理(NLP)数据的平台,提供可视化和探索功能,旨在为 NLP 社区提供一个集体记忆单元,支持多项功能,包括 TweetExplorer,可按主题探索推文,为会议和研讨会提交截止日期建立时间线,并将 NLPExplorer 科学文献搜索引擎与研究论文相关的推文整合在一起。
Jun, 2021
自然语言处理作为一种计算机工具,可对政治活动中的文本进行解析,包括文本分类、主题建模、事件提取和文本标度等方法,并且这些方法可以用于数据收集、政策解释、政策沟通和政策影响调查等四大应用领域。但同时也需要注意潜在的局限性和伦理问题。
Feb, 2023
本文介绍了如何构建一个基于在线社交网络的分类器来筛选有关地震的推文,以减少公众在自然灾害时获取相关信息的难度。通过使用 2010 年智利地震的数据集,作者们研究了类不平衡和维度降低等变量对 5 种分类器的影响,为构建类似系统提供了重要的参考和建议。
Mar, 2015