从新闻中学习：在 Twitter 上预测实体的热度

Jul, 2016

从新闻中学习：在 Twitter 上预测实体的热度

Learning from the News: Predicting Entity Popularity on Twitter

Pedro Saleiro, Carlos Soares

TL;DR本文使用监督学习方法，基于新闻周期预测 Twitter 上实体的受欢迎程度，并提取四类特征进行预测，结果表明新闻是预测 Twitter 实体受欢迎程度的良好信息源。

Abstract

In this work, we tackle the problem of predicting entity popularity on twitter based on the news cycle. We apply a supervised learn- ing a

发现论文，激发创造

社交媒体中的新闻脉搏：流行度预测

本文旨在通过建立多维特征空间来分析新闻文章的性质，采用回归和分类算法预测其在线受欢迎程度，发现可在 Twitter 上以 84% 的准确率范围内预测其受欢迎度，并突显传统来源与社交网络受欢迎性的差异。

Feb, 2012

利用今日 Twitter 的讨论预测明日的头条新闻

通过考虑 Twitter 上的用户参与和反应，使用社交媒体数据为基础，提出一种新的模型来预测新闻文章的流行度，在选取的 300 篇政治新闻文章中，该方法优于其他基线模型。

Jan, 2019

EEPT: 使用语义相似度在 Twitter 中早期发现新兴实体

本文提出了一种通过语义聚类短信息的方法来早期发现新兴实体，并设计并利用性能评估指标来评估该方法的性能表现。结果表明，该提议方法发现的新兴实体不仅仅是 Twitter 趋势的范畴。

Jul, 2022

在在线新闻文档中积极预测句子特定信息的普及度

本文提出将句子级别的普及度预测作为序列回归任务，通过使用自然语言内容在在线新闻文档中预测句子的流行度，并提出一种基于 BERT 的神经模型和辅助任务中的句子重要性预测的转移学习方法。使用生成的一组句子级别的流行度注释，建立第一个可自动创建的数据集 InfoPop。研究表明，从句子重要性的预测中进行转移学习可以加强句子流行度的预测。

Dec, 2022

推文中的命名实体识别与链接分析

本文讨论了对于不规则、嘈杂、依赖上下文及动态性的推文（一种微博形式），运用自然语言处理技术进行挖掘和智能信息访问的挑战，重点关注了从推文中提取实体并进行实体消歧的任务，介绍了一个新的 Twitter 实体消歧数据集，并对多个最先进的 Named Entity Recognition & Disambiguation 模型进行了实证分析。

Oct, 2014

为决策支持形成推特的预测特征

本篇文章阐述了使用图论、频繁项集和关联规则理论，构建和检索不同特征来进行推测性分析，揭示与指定实体相关的推文的语义结构。并且证明了语义频繁项集的定量特征可以用于具有指定目标变量的预测回归模型。

Jan, 2022

将文章分解为事实和观点，并检索实体进行问题导向的摘要生成

该研究利用自然语言处理技术预测股票价格波动，旨在早期发现能够捕捉市场机会的经济、政治、社会和技术变化。通过从新闻文章中识别重要事实和事件，并使用这些事实与实体形成元组，以获取特定实体的市场变化摘要，最后结合所有摘要形成整篇文章的最终摘要。使用大型语言模型 GPT 3.5 进行摘要提取，并分析维基百科数据和《经济学家》的文章以建立公司和实体之间的关系。该研究旨在开发一种全面的系统，通过提前发现市场趋势和事件，为金融分析师和投资者提供更加明智的决策工具。

Oct, 2023

利用社会动态模型预测新闻的受欢迎程度

预测社交媒体中受欢迎的内容具有挑战性，但是我们利用用户早期反应构建的随机模型可以预测受欢迎的程度，并结合网站设计方面的因素，提高了预测的准确性。

Apr, 2010

预测推文流行度的贝叶斯方法

本研究应用贝叶斯方法通过观测 Twitter 上短消息的转发情况和本地网络结构的信息，预测了短消息的传播程度和转发总数，有效提前几分钟预测结果，对于理解社交网络中的广义思想、主题或趋势的传播有潜在的启示作用。

Apr, 2013

微博中新兴实体的早期发现

本研究提出了一种基于时态远程监督的有效方法，以揭示刚被引入公众视野通过微博出现的真正的新兴实体，并以大规模 Twitter 存档的实验结果证明，该方法发现的前 500 个新兴实体的精度达到了 83.2％。

Jul, 2019