在不同粒度上分析新闻文章中的政治偏见和不公平性
研究表明,媒体的政治偏见会影响受众的政治信仰及投票行为。通过三个手动注释的数据集及不同的可视化策略测试,结果表明手动注释偏见的可视化比框架可视化更有效。通过多层次模型,可以发现记者的偏见与文章的政治极端性和公正性有显著联系。
May, 2021
通过研究基于高斯混合模型的概率分布,发现频率和位置对于文章层面的媒体偏见检测至关重要,其次是其精确的时序,相较于只依赖于低水平词汇信息分布的特征和神经文本分类方法。
Oct, 2020
新闻报道中的偏见表现和影响是社会科学的核心主题,近年来在自然语言处理领域受到了越来越多的关注。本研究综述了社会科学的方法,并将其与自然语言处理领域中用于分析媒体偏见的典型任务表述、方法和评估指标进行了对比。我们讨论了开放性问题,并提出了可能的研究方向,以填补理论与预测模型之间及其评估之间的差距。这些包括模型透明度、考虑文档外部信息以及跨文档推理而非单一标签的分配。
Sep, 2023
利用可靠的外部数据资源学习新闻文章的公正表示,提出了一种知识注入的深度学习模型,旨在预测新闻文章的政治倾向,解决了现有学习模型在模型训练中受到新闻发布者的政治偏见影响的问题,从而消除了算法政治偏见,并在准确性方面优于基线方法,可达到 73% 的准确率。
Sep, 2023
使用真实新闻机构的评级,我们创建了一份多语言新闻语料库,其中包括粗略的立场注释(左翼和右翼)以及自动提取的主题注释。我们展示了使用这些数据训练的分类器能够识别英语、德语、西班牙语和加泰罗尼亚语中大部分未见过的报纸的编辑立场。我们随后将这些分类器应用于 ChatGPT 和 Bard 在四种语言中撰写的 101 篇类似报纸文章,并观察到,类似传统报纸,ChatGPT 的编辑立场会随着时间而演变,并且作为一个数据驱动的系统,生成的文章在不同语言中的立场也有所不同。
Oct, 2023
本文提出了一种新的多头分层注意力模型,通过考虑句子层面的语义和文档层级的修辞结构,有效地编码长文档的结构,从而实现了对新闻文章政治倾向的更为健壮和风格无关的检测,并证明了该方法的优越性和准确性。
Apr, 2023
通过对新闻媒体进行研究,我们揭示了其如何在报道中通过事件的包含或省略来影响公众意见,突出了新闻 subtly shapes opinion 的方式。
Oct, 2023
本篇论文是一项关于新闻文章句子级别的事实性和偏见研究,通过手动标注数据集并 fine-tuning BERT 模型的方法,我们得出了不同媒体和领域新闻报道中存在的偏见和事实的表现情况。
Jan, 2023