多任务序数回归联合预测新闻媒体的可信度和主要政治意识形态
该研究通过构建多模数据集和深度学习算法,探讨了基于视频和音频进行新闻YouTube频道的政治意识形态预测问题,并在文本和元数据的基础上通过使用声音信号,将偏见检测能力提高了6%以上。
Oct, 2019
本文探讨新闻文章中的政治意识形态或偏见的预测任务,提出了一个具有挑战性的实验设置并收集了大量的数据集,在建模方面使用了敌对媒体适应和三元组损失等策略,并在文章级别上加入了源背景信息,实验结果表明这种方法在这种具有挑战性的情况下比使用先进的预先训练转换器有相当大的改进。
Oct, 2020
本研究利用一个新的、基于6964篇新闻文章的辅助指标标签的语料库,开发了一种神经模型对新闻文章中的政治偏见和不公平进行分析,并从单词到整篇文章的不同层次的文本粒度发现了深刻的偏见模式。
Oct, 2020
研究新闻媒体的意识形态倾向与分化对于推进当代政治的理解至关重要。本文提出一种新颖而细粒度的意识形态研究方法,利用在左右方向上的立场来分析问题,并介绍了第一个描绘意识形态多维度构建并由政治科学家和语言学家进行标注的新闻文章文本数据集。通过控制作者立场,我们的方法可以量化地测量并研究多维度的意识形态距离与变化。本文进一步提出了基于模型的意识形态预测,这与基于立场的检测是一个挑战性的研究任务。
Jun, 2021
开发了一种机器学习分类器,通过社交媒体上的非政治文本和用户关注的账户来推断政治取向,并发现新闻分享存在鲜明的左右分化,而体育新闻则不具有政治倾向性。
Aug, 2022
本文采取人工辅助机器学习框架,针对具有代表性的3个主流媒体倾向组(左,中,右)在2014年至今发布的2.2万份手动标记和180万份机器标记的新闻标题进行了超党派新闻标题检测的数据集开发,并在外部验证集上取得了0.84的准确度和0.78的F1得分;针对新闻标题中的党派性进行了计算分析,发现右翼媒体倾向于使用比例更高的超党派标题;通过逻辑回归模型和Shapley值确定了几个主题,并应用基于词库的语言分析工具对每个主题的标题进行了分析,发现左派、中派和右派媒体在外交、政治和社会问题方面的语言差异逐渐减小。
Jan, 2023
研究通过分析Reddit社群和新闻媒体等大规模真实语言使用数据,使用词嵌入模型发现了政治性语言中存在的情感分化模式以及与七个政治话题相关的词语的语义关联,揭示了跨党派界限的道德联想差异,这些结果强调了虽然在政治谱系上有着共享的道德理解,但仍然存在着塑造党派语言并潜在加剧政治极化的一致差异。
Oct, 2023
新闻媒体塑造公众舆论,通过选取或省略支持某一方的党派事件以隐晦的方式塑造信息受众的观点,本研究通过比较多篇关于相同事件的新闻文章,并识别出揭示意识形态的党派事件,开发了一种基于潜变量的框架来预测新闻文章的意识形态,发现新闻报道的倾向性可以通过文章之间的对齐和交叉比较获得,相比竞争性基准模型更为准确,结果揭示了媒体的高层次偏见存在,即使是在拥有客观和无党派的强烈规范的主流媒体中也是如此。
Oct, 2023
通过使用大规模语言模型(LLMs)来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论,本研究创新性地采用了一个指导调整的LLM,以反映一系列政治意识形态。我们提出了一个综合的分析框架,包括党派偏见差异评估和党派倾向预测,以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性,但在立场检测方面存在一些挑战,突显了NLP工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示LLMs中细致的政治理解的可行性和重要性,特别适用于需要敏锐意识到政治偏见的应用,为该领域做出了重要贡献。
Nov, 2023
通过使用新闻媒体偏见和帖子内容来标记社交媒体帖子的两种启发式方法,以及与随机抽取的人工标注数据集进行比较,我们展示了当前机器学习模型在预测社交媒体帖子的政治倾向方面的改进性能,采用传统的监督学习和少样本学习设置。
Nov, 2023