新闻传播壁垒分类
利用维基百科概念和每个障碍物相关的元数据,我们提出了一种检测新闻传播障碍的方法,并得到了高精度的验证结果。我们相信这种方法可以为未来预测信息传播障碍的系统提供有用的洞察力。
Jan, 2023
利用 COMET 推理模型和新闻标题的情感,通过采集和标记新闻标题的元数据来检测新闻传播中的文化、经济、政治、语言和地理障碍,并将提取到的语义知识和情感作为特征,相对于传统文本分类方法和深度学习可获得更好的表现(对于文化、经济、政治和地理的十个类别的平均 F1 - 分数分别从 0.41、0.39、0.59 和 0.59 提高至 0.47、0.55、0.70 和 0.76)。
Apr, 2023
本文提出了一种从文本中支持文化分析的方法,通过不同地理位置中不同类别的新闻事件(社会、商业、健康、娱乐、科学、购物、体育、艺术、计算机、游戏和家庭)的分类,演示了该方法的实用性。我们根据不同国家 / 地区遵循的文化将国家 / 地区进行分组,并根据其内容类别筛选新闻事件。然后利用 Hofstede 的文化维度自动标记新闻事件,并提供不同分类方法的表现,同时也比较了不同特征数量,以找到适合表示文化的特征集。
Jan, 2023
使用机器学习算法分析媒体新闻的语言特征,以区分真假新闻,主要解决神经假新闻生成、机器生成的标题、文本和图像标题之间的语义矛盾等问题。同时提出应用特征集和类别、特征之间的相关性计算相关属性评估指标和计算属性变量的协方差指标来模拟这些问题。其中独特、负面、积极和基数数字特征在度量中得分高,能够提供高的 AUC 和 F1-score。
Nov, 2022
通过研究基于高斯混合模型的概率分布,发现频率和位置对于文章层面的媒体偏见检测至关重要,其次是其精确的时序,相较于只依赖于低水平词汇信息分布的特征和神经文本分类方法。
Oct, 2020
本研究利用一个新的、基于 6964 篇新闻文章的辅助指标标签的语料库,开发了一种神经模型对新闻文章中的政治偏见和不公平进行分析,并从单词到整篇文章的不同层次的文本粒度发现了深刻的偏见模式。
Oct, 2020
本文提出一种使用 Wikidata 知识库的方法来产生新闻文章的语义注释,并描述了一种语义搜索引擎,支持基于关键词的搜索和结构化数据搜索。
Apr, 2019
为了应对每天都暴露在误导性和宣传性新闻文章和媒体帖子中的在线用户,我们提出了一种检测和展示这些技术的方法,以提供可解释性。特别地,我们定义了定性描述性特征,并分析了它们检测欺骗技术的适用性,同时表明我们的可解释性特征可以与预训练语言模型轻松结合,产生最先进的结果。
Aug, 2021
本文运用 GDELT 项目所收集的大规模新闻报道数据集,通过分层(混合效应)回归模型,揭示了全球灾难新闻报道的结构及其决定因素。结果表明许多变量,例如人口数量、政治稳定性和灾害破坏程度等,与既有研究趋势一致。同时,强烈的地域主义发现强调了进行全球新闻报道研究的综合性数据集的必要性。
Oct, 2014
研究表明,媒体的政治偏见会影响受众的政治信仰及投票行为。通过三个手动注释的数据集及不同的可视化策略测试,结果表明手动注释偏见的可视化比框架可视化更有效。通过多层次模型,可以发现记者的偏见与文章的政治极端性和公正性有显著联系。
May, 2021