- 如何识别重要紧急新闻?
发现新闻聚类数据集中的聚类简单属性与新闻的重要性和紧迫性相关,在不同的数据集、数据集大小、聚类算法和嵌入中验证了该发现。这种相关性可用于使用聚类(作为替代 LLM)来识别最重要紧急的新闻,或者用于过滤掉不重要的文章。
- EMNLP从麻烦到新闻触觉:通过跨文档证据和背景增强新闻
NEWSSENSE 使用参考无关的事实验证方法,将用户选择的主要文章与多个不同来源的相关文章链接起来,提供内嵌高亮显示来说明所选文章中特定主张是如何被其他文章的信息支持或反驳的,以帮助用户毫不费力地消化和交叉检查多个信息来源,以及识别关键信 - 从新闻构建和解释因果知识图谱
本文提出了一种从新闻中构建因果知识图谱的方法,其中采用了基于 BERT 的抽取模型和主题模型等技术,最终实现了高召回率、高精度和高连通性的知识图谱,有效地捕捉和传达因果关系。
- 利用特征增强和软域迁移进行欺诈检测
利用神经网络模型的中间层表示,我们提出了一种特征增强方法,用于不同信息领域之间的欺骗检测,其中 Tweets 对于虚假新闻和网络钓鱼邮件检测最有帮助,而新闻对于推特谣言检测最有帮助,我们的分析为领域知识转移提供了有用的见解,可以帮助构建比现 - ACL通过对比学习检测新闻标题中的上下文引用
QuoteCSE 是一种对新闻文章引用的嵌入式对比学习框架,它基于正负样本的域驱动来识别新闻标题中的语境引用,从而提高报导的可信度。
- 自然语言处理在电力需求分析中的定量探讨
本文探讨了如何更好地利用新闻中包含的社会信息来理解能源需求方面的人口总体行为,并通过实验分析从国家新闻中提取的预测特征对日前电力需求预测的影响,实验结果表明最佳表现模型可将官方标准误差在 RMSE、MAE 和 SMAPE 方面降低约 4%、 - 新闻分类数据集
本论文介绍了一份包含近 21 万篇新闻头条的数据集,收集自 HuffPost,并探讨了该数据集在自然语言处理领域的现有和潜在应用,这对于学习真实新闻的语法和语义至关重要,尤其在当前假新闻泛滥的背景下。
- ACL从网络评论的毒性到美国新闻的不文明:谨慎行事
通过对美国新闻的礼貌性手动标注的语料库,测试 Jigsaw Perspective API 是否能够检测到不礼貌的程度,结果表明,Perspective 等模型无法很好地分析新闻中的不礼貌性,需要开发去除新闻中经常提到的词之间的虚假相关性的 - Whatsapp 上的政治群组中的图片和错误信息:以印度为例
研究 WhatsApp 在 2019 年印度全国选举前期所传播的新闻与谣言,发现约 13%的共享图像为已知的错误信息,并分析了这些图像的类型,当使用机器学习方法预测病毒性图像时,容易受到内容变化的影响。
- 预测新闻情感对股市的影响
通过情感分析市场新闻,本文针对金融市场制定了情感分析字典和模型,并对医药股市的新闻进行了分析,得出仅从新闻情感中,对于预测短期股价趋势有 70.59% 的准确率。
- AAAI通过深度分层编码器检测新闻标题与正文之间的不一致
该研究提出了一种可以用来检测标题与新闻正文之间脱节的百万级新闻标题和正文文本数据集,基于此数据集,该研究开发了两个神经网络来检测标题与正文之间的脱节,并提出了一种数据增强方法来进一步提高性能。实验结果表明,所提出的方法优于现有方法,可以有效 - 倾听混沌的耳语:一种应用于新闻导向的股票趋势预测的深度学习框架
通过自然语言处理和文本挖掘技术,利用新闻内容预测股票趋势并对在线内容的低质量、不可靠性和全面性进行解决,提出了一种混合注意力网络来捕捉前两个原则,并应用了自主学习机制来模仿第三个原则。在真实股市数据上的广泛实验表明了这种方法的有效性。
- ACL单文档新闻摘要中的(非)重要内容检测
本研究提出了一种鲁棒的方法,通过训练文档 - 摘要配对的语料库来检测新闻中内在句子的重要性,并结合‘文档开头’启发式方法,用于单篇文档摘要,得到了比现有先进摘要算法和基线方法更好的结果,这是一个重要的进步。
- AAAI社交媒体上故事的高效自动检测方法
本文提出了一种半自动化工具来有效地在 Twitter 上辨识和追踪真实世界事件的故事,并通过 25 名参与者的用户研究证明我们的工具相对于传统方法可以提高追踪真实世界事件故事的速度和准确性。