KHAN: 知识感知分层注意力网络用于准确的政治立场预测
本文提出了一种基于关注机制的多角度模型,利用文本、标题、内容以及链接结构等多种视角识别新闻文章所展现出的政治意识形态,实验证明该模型在自然语言处理的表示学习和网络科学中的进展方面,比现有的基线模型在F1得分上提高了10个百分点。
Sep, 2018
本文提出了一种基于推文训练的两步分类方案,用于检测长文本中的政治偏见。该方案包括通过推特数据训练中性检测器,用于去除文章中的中性句子以实现意见集中,并提高了文章的预测准确性。
Sep, 2019
本文提出了一种利用外部领域知识进行政治观点识别的KGAP方法,该方法在构造政治知识图谱的基础上,结合异构信息网络来表示新闻文本与外部知识,并采用关系图神经网络进行政治观点检测,实验结果表明该方法在现实世界的识别标准中表现最佳。
Aug, 2021
本文提出一种名为KCD的方法,通过多跳知识推理和文本线索作为段落级标签来进行政治观点的检测,该方法可帮助打破信息封闭和政治极化,实验表明该方法在两个基准数据集上优于当前最先进的方法。
Apr, 2022
本文介绍了使用基于意识形态的预训练目标的预训练语言模型进行意识形态预测的新方法,并介绍了一个大规模数据集POLITICS,该数据集包含超过3.6M篇政治新闻文章,并展示该模型在意识形态预测和立场检测任务上的性能优越性。
May, 2022
本文提出了一种新的多头分层注意力模型,通过考虑句子层面的语义和文档层级的修辞结构,有效地编码长文档的结构,从而实现了对新闻文章政治倾向的更为健壮和风格无关的检测,并证明了该方法的优越性和准确性。
Apr, 2023
利用可靠的外部数据资源学习新闻文章的公正表示,提出了一种知识注入的深度学习模型,旨在预测新闻文章的政治倾向,解决了现有学习模型在模型训练中受到新闻发布者的政治偏见影响的问题,从而消除了算法政治偏见,并在准确性方面优于基线方法,可达到73%的准确率。
Sep, 2023
使用真实新闻机构的评级,我们创建了一份多语言新闻语料库,其中包括粗略的立场注释(左翼和右翼)以及自动提取的主题注释。我们展示了使用这些数据训练的分类器能够识别英语、德语、西班牙语和加泰罗尼亚语中大部分未见过的报纸的编辑立场。我们随后将这些分类器应用于ChatGPT和Bard在四种语言中撰写的101篇类似报纸文章,并观察到,类似传统报纸,ChatGPT的编辑立场会随着时间而演变,并且作为一个数据驱动的系统,生成的文章在不同语言中的立场也有所不同。
Oct, 2023
通过使用大规模语言模型(LLMs)来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论,本研究创新性地采用了一个指导调整的LLM,以反映一系列政治意识形态。我们提出了一个综合的分析框架,包括党派偏见差异评估和党派倾向预测,以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性,但在立场检测方面存在一些挑战,突显了NLP工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示LLMs中细致的政治理解的可行性和重要性,特别适用于需要敏锐意识到政治偏见的应用,为该领域做出了重要贡献。
Nov, 2023