量化推特上的极化:卡瓦诺提名
通过分析近 8 年来 679,000 个用户在 Twitter 上的行为,研究表明社交媒体在政治话语形成中扮演了重要角色,同时也加剧了政治两极化现象。该研究是少数具有长期展望的,涵盖两次美国总统选举和两次中期选举的罕见纵向分析之一。
Mar, 2017
通过神经嵌入技术对 Reddit 14 年间 5.1B 评论的社区结构进行了研究,发现在 2016 年美国总统选举后,Reddit 出现了明显的政治极化,尤其是右翼用户的活动量增加导致的。个体级的极化是罕见的,政治极化可以通过考察单个用户的行为预测,可能因外部事件而发生。
Oct, 2020
本文提出了一种基于 NLP 的框架,通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面,并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对 21 起大规模枪击事件中的 4.4M 条推文进行研究,发现这些事件的讨论在政治上高度极化。结果表明,共和党更关注枪手和事件特定事实,而民主党则更关注受害者和政策变化的呼吁。同时,作者还发现了一些引导言论极化的表达方式,诸如 “基础事实” 以及 “恐怖分子” 和 “疯子” 这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法,并提供了计算方法来研究这些现象。
Apr, 2019
研究通过分析 Reddit 社群和新闻媒体等大规模真实语言使用数据,使用词嵌入模型发现了政治性语言中存在的情感分化模式以及与七个政治话题相关的词语的语义关联,揭示了跨党派界限的道德联想差异,这些结果强调了虽然在政治谱系上有着共享的道德理解,但仍然存在着塑造党派语言并潜在加剧政治极化的一致差异。
Oct, 2023
本文利用卷积神经网络对土耳其大选期间推特数据进行无监督的极性检测,对 108M 条推文和 213M 条用户推特进行多目标分类和极性聚类,实现用户态度识别和相关话题极化计算。
May, 2020
研究发现,使用社交媒体平台的用户只需发表 13 篇与社会相关的帖子即可预测其政治取向,作者通过创新的半自动化方法来发现用户的政治倾向,并公开了波兰的 POLiTweets 数据集,以研究多党制的政治倾向和领域转移等问题。
Jun, 2022
通过使用新闻媒体偏见和帖子内容来标记社交媒体帖子的两种启发式方法,以及与随机抽取的人工标注数据集进行比较,我们展示了当前机器学习模型在预测社交媒体帖子的政治倾向方面的改进性能,采用传统的监督学习和少样本学习设置。
Nov, 2023
通过使用语言模型分析美国政治体系中的政治极化,我们提供了对候选人立场的分析信息,以帮助选民了解其在经济、医疗保健、教育和其他社会问题上的观点,并进一步分析候选人的数据集和使用 “Longformer” 这样更强大的方式,找到每个候选人在其政治观点和背景上的最近邻。
Jan, 2023
本研究分析 2020 年美国大选期间,支持者在社交媒体上对候选人的仇恨和冒犯性言论,建立了针对这些言论的标注任务,并采用 BERT 基线分类器评测了该任务的性能,从而为针对仇恨语言的计算模型提供了一种新的公开资源。
Mar, 2021
本文研究了政治极化与 Twitter 用户报道的 “fake news” 相关内容之间的关系,并发现极化增加与带有 fake news 关键词和标签的 URL 的用户数量提高,讨论了这些发现对于在打击假消息的持续斗争中跟踪 “fake news” 的挑战的影响。
Jun, 2017