直观而明显:事实报道镜头下的媒体偏见
本篇论文是一项关于新闻文章句子级别的事实性和偏见研究,通过手动标注数据集并 fine-tuning BERT 模型的方法,我们得出了不同媒体和领域新闻报道中存在的偏见和事实的表现情况。
Jan, 2023
本研究利用一个新的、基于 6964 篇新闻文章的辅助指标标签的语料库,开发了一种神经模型对新闻文章中的政治偏见和不公平进行分析,并从单词到整篇文章的不同层次的文本粒度发现了深刻的偏见模式。
Oct, 2020
研究表明,媒体的政治偏见会影响受众的政治信仰及投票行为。通过三个手动注释的数据集及不同的可视化策略测试,结果表明手动注释偏见的可视化比框架可视化更有效。通过多层次模型,可以发现记者的偏见与文章的政治极端性和公正性有显著联系。
May, 2021
新闻报道中的偏见表现和影响是社会科学的核心主题,近年来在自然语言处理领域受到了越来越多的关注。本研究综述了社会科学的方法,并将其与自然语言处理领域中用于分析媒体偏见的典型任务表述、方法和评估指标进行了对比。我们讨论了开放性问题,并提出了可能的研究方向,以填补理论与预测模型之间及其评估之间的差距。这些包括模型透明度、考虑文档外部信息以及跨文档推理而非单一标签的分配。
Sep, 2023
通过研究基于高斯混合模型的概率分布,发现频率和位置对于文章层面的媒体偏见检测至关重要,其次是其精确的时序,相较于只依赖于低水平词汇信息分布的特征和神经文本分类方法。
Oct, 2020
本文旨在研究预测新闻媒体报道的真实性和偏见。通过大量的新闻网站以及一些从文章、维基百科页面、推特账户、网址结构和流量信息中得出的特征,实验表明本方法相比基线有较显著的性能提升,且各特征类型都至关重要。
Oct, 2018
媒体偏见检测需要综合多个新闻来源的信息,以句子级别的政治偏见检测为例,通过考虑上下文中的偏见而进行的任务被证明是一项具有挑战性的任务。我们提出了一种更加小心地搜索上下文的技术,采用偏见敏感和目标感知的数据增强方法,通过与 BERT 等预训练模型的结合,在著名的 BASIL 数据集上进行了综合实验,取得了 58.15 的 F1 得分,明显优于先前方法的最新偏见检测任务。
Oct, 2023
通过对媒体的语言和社会背景进行分析,我们通过整体媒体特征对新闻机构进行刻画从而自动检测出可能的 “假新闻”,并且将多种信息来源进行整合可以得到更好的结果。
May, 2020