生成与政治相关的事件数据
本研究旨在自动从新闻中提取社会政治事件,并讨论计算语言学和社会政治学研究在大规模跨源、跨国和跨语言的社会政治事件信息收集中的相互支持,研究内容包括机器学习方法学的评估、语言资源、物质冲突预测、核心参照识别等。
May, 2020
本文介绍了如何利用自然语言处理技术(如基于机器学习或神经网络的技术)来发现不同平台上的政治内容,并使用三组数据集对依赖于字典、监督学习或神经网络的三组检测技术的表现进行了系统比较。我们还对数据的不同预处理模式的影响进行了检验,结果表明,在处理较少噪声的数据时,使用基于神经网络和机器学习的模型效果最佳,而在处理噪声较多的数据时,使用基于字典的模型效果更为稳健。
Jul, 2022
本文介绍了一种自动地从文本中找到政治事件发生地点的方法,基于一个包含 8,000 个标签的句子集合,使用了一种将自动提取的事件和文本位置联系起来的方法,该模型在注释任务上达到了人类水平表现,胜过了先前的事件地理定位系统,并可应用于大多数地理环境下的事件提取系统。本文形式化了事件 - 位置链接任务、描述了神经网络模型,并演示了一个工作流来回答叙利亚内战中传统军事攻势导致平民伤亡的开放性问题。
May, 2019
本文介绍了一种基于深度神经网络的技术框架,用于在 Twitter 上连续纵向地识别和分析选举相关的对话,其模型可以将选举相关的推文检测的 F 分数为 0.92,并将这些推文分类为 22 个主题,其 F 分数为 0.90。
May, 2016
本文介绍了基于最新自然语言处理技术的有效定制事件数据集制作的 “窍门”,并提出了训练事件类别分类器、使用大型语言模型和标准机器学习分类器识别文本中的行动者和接收方、将演员的提及解析到其维基百科文章以对其进行分类等各种技术。通过举例,我们展示了这些技术如何产生新的 POLECAT 全球事件数据集,以取代 ICEWS,并快速制作小型、定制的事件数据集。最后,我们公布了实现上述新技术的代码和模型。
Apr, 2023
自然语言处理作为一种计算机工具,可对政治活动中的文本进行解析,包括文本分类、主题建模、事件提取和文本标度等方法,并且这些方法可以用于数据收集、政策解释、政策沟通和政策影响调查等四大应用领域。但同时也需要注意潜在的局限性和伦理问题。
Feb, 2023
本研究利用组合式阅读器模型对具有不同事件的多篇文档进行分析,以捕获并利用政治实体对特定事件所持的内在议程,从而形成多个实体、问题或事件的有效表征,通过定量和定性分析表明该模型是有意义和有效的。
Dec, 2020
社交平台是传播和讨论真实事件信息的关键平台,本研究提出了一种利用社交数据的词汇、语义和上下文表示来检测社交事件的框架,通过利用上下文知识在最早的阶段检测语义相关的推文并提高聚类质量,进而展示每个事件的演变变化。经过广泛实验验证了该框架在检测和区分社交事件方面的有效性。
Jul, 2023
本文介绍了基于计算机视觉和深度学习的自动化方法,用于分析大规模的图像数据,并说明了它们的用途和实现。进一步地讨论了这些方法和结果的验证和解释,以及它们如何对政治传播、身份与政治、发展和冲突的研究做出贡献,从而启用了一系列的大规模研究问题。
Oct, 2018