社交媒体事件主题建模的语义模块化框架
本文提出了一种 Semantic Pivoting Model for Effective Event Detection (SPEED)—— 显式地在训练期间整合先前信息,捕捉输入与事件之间语义上的相关性,在多个设置中取得最先进的性能,并优于基线方法而不使用任何外部资源。
Nov, 2022
社交平台是传播和讨论真实事件信息的关键平台,本研究提出了一种利用社交数据的词汇、语义和上下文表示来检测社交事件的框架,通过利用上下文知识在最早的阶段检测语义相关的推文并提高聚类质量,进而展示每个事件的演变变化。经过广泛实验验证了该框架在检测和区分社交事件方面的有效性。
Jul, 2023
通过结合大型语言模型和聚类分析,利用自动化事件检测框架从全球事件、语言和情感数据库(GDELT)中检测新闻事件,并通过关键词提取、文本嵌入、事件摘要和主题标签等任务加强事件聚类,以提供有价值的洞察力和增强新闻报道的准确性和深度。
Jun, 2024
本研究提出了一种新颖的、具有层级结构的半监督事件建模框架,结合序列潜变量模型和本体知识,通过一系列的结构化潜变量层对语义知识进行制导,成功提高事件建模的表现,并在两个数据集上的四种不同评估指标上均优于先前现有的最佳方法。
Dec, 2022
社交媒体时代为企业开启了新的机遇,但其中的文本数据分析则面临着诸多挑战。本研究针对嘈杂、大数据背景下的无监督主题提取问题,提出了三种基于变分自编码器框架的方法,并在实际使用案例中对这些方法进行了测试,证明了它们相较于现有方法在主题建模领域能够取得同等或更好的性能,并指出主题建模领域需要改进评估指标。
Jul, 2023
本研究提出了一种以聚类为基础的实时事件发现系统,能够将 Twitter 上的实时数据进行聚类,识别出不同的事件,并使用 novel metric 评估聚类方法的效果和在实时和线下模式下的表现,实验结果表明该系统在大规模数据上具有很高的效率和准确性。
Jul, 2019
本文提出一种基于事件的异构信息网络,结合外部知识库,基于元路径相似度搜索的社交事件检测和演化发现框架,并利用基于加权元路径实例相似性和文本语义表示的新颖 PP-GCN 对社交事件进行细粒度分类,该框架优于其他替代的社交事件检测和演化发现技术。
Apr, 2021
本文提出了一个基于对抗生成网络的事件提取模型,可以对长文本进行结构化表示,实验结果显示该模型在三个数据集上的表现优于基线模型,尤其在新闻文章数据集上提高了 15% 的 F - 度量值。
Aug, 2019
本文提出了一种基于多模态分布语义嵌入的零样本事件检测方法,以视频为载体,将对象和动作等概念以及其他可用形式的多模态信息嵌入到分布语义空间中,实现了自由文本事件查询、概念属性的自动确定、视频检索等功能,在 TRECVID MED 大规模多媒体事件检测挑战中验证,有效性和速度均优于目前最先进的技术水平。
Dec, 2015
本文提出了一个针对社交媒体帖子进行处理的原型框架,旨在考虑市政决策。该框架通过以下三个步骤实现:(1) 确定每个社交媒体帖子的情感极性,(2) 识别流行主题并将其映射到各个帖子,以及 (3) 将这两个信息合并成表示对每个主题表达的整体情感的模糊数。该框架在约两个月的时间里,使用捷克奥斯特拉发表的推文进行演示,展示了模糊数在更丰富方式中表示情感,以及捕捉社交媒体上表达的各种观点。
Aug, 2023