本文旨在通过建立多维特征空间来分析新闻文章的性质,采用回归和分类算法预测其在线受欢迎程度,发现可在 Twitter 上以 84% 的准确率范围内预测其受欢迎度,并突显传统来源与社交网络受欢迎性的差异。
Feb, 2012
通过考虑 Twitter 上的用户参与和反应,使用社交媒体数据为基础,提出一种新的模型来预测新闻文章的流行度,在选取的 300 篇政治新闻文章中,该方法优于其他基线模型。
Jan, 2019
本文提出了一种通过语义聚类短信息的方法来早期发现新兴实体,并设计并利用性能评估指标来评估该方法的性能表现。结果表明,该提议方法发现的新兴实体不仅仅是 Twitter 趋势的范畴。
Jul, 2022
本文提出将句子级别的普及度预测作为序列回归任务,通过使用自然语言内容在在线新闻文档中预测句子的流行度,并提出一种基于 BERT 的神经模型和辅助任务中的句子重要性预测的转移学习方法。使用生成的一组句子级别的流行度注释,建立第一个可自动创建的数据集 InfoPop。研究表明,从句子重要性的预测中进行转移学习可以加强句子流行度的预测。
Dec, 2022
本文讨论了对于不规则、嘈杂、依赖上下文及动态性的推文(一种微博形式),运用自然语言处理技术进行挖掘和智能信息访问的挑战,重点关注了从推文中提取实体并进行实体消歧的任务,介绍了一个新的 Twitter 实体消歧数据集,并对多个最先进的 Named Entity Recognition & Disambiguation 模型进行了实证分析。
Oct, 2014
本篇文章阐述了使用图论、频繁项集和关联规则理论,构建和检索不同特征来进行推测性分析,揭示与指定实体相关的推文的语义结构。并且证明了语义频繁项集的定量特征可以用于具有指定目标变量的预测回归模型。
Jan, 2022
该研究利用自然语言处理技术预测股票价格波动,旨在早期发现能够捕捉市场机会的经济、政治、社会和技术变化。通过从新闻文章中识别重要事实和事件,并使用这些事实与实体形成元组,以获取特定实体的市场变化摘要,最后结合所有摘要形成整篇文章的最终摘要。使用大型语言模型 GPT 3.5 进行摘要提取,并分析维基百科数据和《经济学家》的文章以建立公司和实体之间的关系。该研究旨在开发一种全面的系统,通过提前发现市场趋势和事件,为金融分析师和投资者提供更加明智的决策工具。
Oct, 2023
预测社交媒体中受欢迎的内容具有挑战性,但是我们利用用户早期反应构建的随机模型可以预测受欢迎的程度,并结合网站设计方面的因素,提高了预测的准确性。
Apr, 2010
本研究应用贝叶斯方法通过观测 Twitter 上短消息的转发情况和本地网络结构的信息,预测了短消息的传播程度和转发总数,有效提前几分钟预测结果,对于理解社交网络中的广义思想、主题或趋势的传播有潜在的启示作用。
Apr, 2013
本研究提出了一种基于时态远程监督的有效方法,以揭示刚被引入公众视野通过微博出现的真正的新兴实体,并以大规模 Twitter 存档的实验结果证明,该方法发现的前 500 个新兴实体的精度达到了 83.2%。
Jul, 2019