多任务序数回归联合预测新闻媒体的可信度和主要政治意识形态
本文探讨新闻文章中的政治意识形态或偏见的预测任务,提出了一个具有挑战性的实验设置并收集了大量的数据集,在建模方面使用了敌对媒体适应和三元组损失等策略,并在文章级别上加入了源背景信息,实验结果表明这种方法在这种具有挑战性的情况下比使用先进的预先训练转换器有相当大的改进。
Oct, 2020
本文采取人工辅助机器学习框架,针对具有代表性的 3 个主流媒体倾向组(左,中,右)在 2014 年至今发布的 2.2 万份手动标记和 180 万份机器标记的新闻标题进行了超党派新闻标题检测的数据集开发,并在外部验证集上取得了 0.84 的准确度和 0.78 的 F1 得分;针对新闻标题中的党派性进行了计算分析,发现右翼媒体倾向于使用比例更高的超党派标题;通过逻辑回归模型和 Shapley 值确定了几个主题,并应用基于词库的语言分析工具对每个主题的标题进行了分析,发现左派、中派和右派媒体在外交、政治和社会问题方面的语言差异逐渐减小。
Jan, 2023
本文提出了一种基于关注机制的多角度模型,利用文本、标题、内容以及链接结构等多种视角识别新闻文章所展现出的政治意识形态,实验证明该模型在自然语言处理的表示学习和网络科学中的进展方面,比现有的基线模型在 F1 得分上提高了 10 个百分点。
Sep, 2018
本文提出了一种基于多任务深度学习训练的 Transformer 架构,使用六个与偏见相关的数据集来解决媒体偏见检测问题,取得了较好的效果。
Nov, 2022
利用 “翻译 - 检索 - 翻译” 策略引入推理通识知识,然后将其整合到多语言预训练语言模型中以预测政治极性,证明我们的框架不受所使用的模型的影响,并具有潜力为新闻从业者、社会科学家、新闻制作人员和消费者带来好处。
Dec, 2022
本文报道了我们在 SemEval-2019 任务 4 中提出的超级党派新闻检测系统,该系统主要使用一些原本用于检测宣传的工程特征。我们训练了一个基于逻辑回归模型的分类器,并使用从简单单词袋到词汇丰富度和文本可读性等特征来训练它。我们的系统在手动注释的测试数据上实现了 72.9% 的准确率,而在带有远程监督标注的测试数据上则实现了 60.8% 的准确率。另外的实验表明,使用更好的特征预处理可以大幅提高性能。
Apr, 2019
本文介绍了以文本和图像为输入的多模态意识形态预测任务,提出了使用针对模型组成部分的预训练目标的效果,建立五个包含政治内容的大型数据集,并通过实验和分析实现了在文本分析中更好的性能。
Nov, 2022
新闻媒体塑造公众舆论,通过选取或省略支持某一方的党派事件以隐晦的方式塑造信息受众的观点,本研究通过比较多篇关于相同事件的新闻文章,并识别出揭示意识形态的党派事件,开发了一种基于潜变量的框架来预测新闻文章的意识形态,发现新闻报道的倾向性可以通过文章之间的对齐和交叉比较获得,相比竞争性基准模型更为准确,结果揭示了媒体的高层次偏见存在,即使是在拥有客观和无党派的强烈规范的主流媒体中也是如此。
Oct, 2023
利用可靠的外部数据资源学习新闻文章的公正表示,提出了一种知识注入的深度学习模型,旨在预测新闻文章的政治倾向,解决了现有学习模型在模型训练中受到新闻发布者的政治偏见影响的问题,从而消除了算法政治偏见,并在准确性方面优于基线方法,可达到 73% 的准确率。
Sep, 2023
本论文通过机器学习方法,建立了一个自由派 - 保守派意识形态空间模型,对推特上的用户和媒体进行了分类,并提出了一种有效的解决信息过滤气泡问题的方法。
Nov, 2017