新闻文章政治意识形态检测的多视角模型
本文探讨新闻文章中的政治意识形态或偏见的预测任务,提出了一个具有挑战性的实验设置并收集了大量的数据集,在建模方面使用了敌对媒体适应和三元组损失等策略,并在文章级别上加入了源背景信息,实验结果表明这种方法在这种具有挑战性的情况下比使用先进的预先训练转换器有相当大的改进。
Oct, 2020
本文介绍了使用基于意识形态的预训练目标的预训练语言模型进行意识形态预测的新方法,并介绍了一个大规模数据集 POLITICS,该数据集包含超过 3.6M 篇政治新闻文章,并展示该模型在意识形态预测和立场检测任务上的性能优越性。
May, 2022
本文介绍了以文本和图像为输入的多模态意识形态预测任务,提出了使用针对模型组成部分的预训练目标的效果,建立五个包含政治内容的大型数据集,并通过实验和分析实现了在文本分析中更好的性能。
Nov, 2022
利用可靠的外部数据资源学习新闻文章的公正表示,提出了一种知识注入的深度学习模型,旨在预测新闻文章的政治倾向,解决了现有学习模型在模型训练中受到新闻发布者的政治偏见影响的问题,从而消除了算法政治偏见,并在准确性方面优于基线方法,可达到 73% 的准确率。
Sep, 2023
本文提出了一种新的多头分层注意力模型,通过考虑句子层面的语义和文档层级的修辞结构,有效地编码长文档的结构,从而实现了对新闻文章政治倾向的更为健壮和风格无关的检测,并证明了该方法的优越性和准确性。
Apr, 2023
本文研究了训练数据中的政治意识形态偏见对自然语言处理模型的影响, 发现大而复杂的模型容易从人选择的输入中传播偏差,从而导致检索准确性的恶化。最后,我们提出一种方法来减轻这种偏差,即学习一个对政治意识形态不变但仍然可以判断主题相关性的文本表示。
Nov, 2020
利用 “翻译 - 检索 - 翻译” 策略引入推理通识知识,然后将其整合到多语言预训练语言模型中以预测政治极性,证明我们的框架不受所使用的模型的影响,并具有潜力为新闻从业者、社会科学家、新闻制作人员和消费者带来好处。
Dec, 2022
本研究提出了一种多任务序数回归框架,其中包含了几个辅助任务,旨在联合模拟新闻媒体的可信度和政治意识形态。研究结果表明,相对于针对单个问题进行建模的模型,联合模型可以获得更好的性能提升。
Apr, 2019
本文提出一种名为 KCD 的方法,通过多跳知识推理和文本线索作为段落级标签来进行政治观点的检测,该方法可帮助打破信息封闭和政治极化,实验表明该方法在两个基准数据集上优于当前最先进的方法。
Apr, 2022