党派语言使用中的道德共识与分歧

Oct, 2023

党派语言使用中的道德共识与分歧

Moral consensus and divergence in partisan language use

Nakwon Rim, Marc G. Berman, Yuan Chang Leong

TL;DR研究通过分析Reddit社群和新闻媒体等大规模真实语言使用数据，使用词嵌入模型发现了政治性语言中存在的情感分化模式以及与七个政治话题相关的词语的语义关联，揭示了跨党派界限的道德联想差异，这些结果强调了虽然在政治谱系上有着共享的道德理解，但仍然存在着塑造党派语言并潜在加剧政治极化的一致差异。

Abstract

polarization has increased substantially in political discourse, contributing to a widening partisan divide. In this paper, we analyzed large-scale, real-world language use in Reddit communities (294,476,146 comm

发现论文，激发创造

在社交媒体中分析极化趋势：以21起大规模枪击事件中的推文为例

本文提出了一种基于NLP的框架，通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面，并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对21起大规模枪击事件中的4.4M条推文进行研究，发现这些事件的讨论在政治上高度极化。结果表明，共和党更关注枪手和事件特定事实，而民主党则更关注受害者和政策变化的呼吁。同时，作者还发现了一些引导言论极化的表达方式，诸如“基础事实”以及“恐怖分子”和“疯子”这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法，并提供了计算方法来研究这些现象。

Apr, 2019

基于文本推断道德情感变化

我们提出了基于文本的框架，通过纵向语料库研究公众道德情感变化。我们的方法建立在语言使用可以反映人们对对与错的道德观念之上，并通过探索从时间序列的词嵌入中学习到的道德偏见来构建我们的方法论。我们的研究为应用自然语言处理技术对社会中的道德情感变化进行表征提供了机会。

Jan, 2020

我们不说同一种语言：通过机器翻译解释极化

通过机器翻译的方式，以词汇为粒度分析分析社交媒体数据集，从而理解不同社区间存在的分化。

Oct, 2020

政治意识形态与政策立场的极化：一种多维度方法

研究新闻媒体的意识形态倾向与分化对于推进当代政治的理解至关重要。本文提出一种新颖而细粒度的意识形态研究方法，利用在左右方向上的立场来分析问题，并介绍了第一个描绘意识形态多维度构建并由政治科学家和语言学家进行标注的新闻文章文本数据集。通过控制作者立场，我们的方法可以量化地测量并研究多维度的意识形态距离与变化。本文进一步提出了基于模型的意识形态预测，这与基于立场的检测是一个挑战性的研究任务。

Jun, 2021

CommunityLM: 从语言模型中探究党派世界观

利用社区语言模型，研究政治言论语言化的分歧，通过观察群体在社交媒体中的表达，详细分析不同派别的观点，并且发现了相对于其他方法更高的对比度。

Sep, 2022

新闻标题中的超级党派性的计算评估

本文采取人工辅助机器学习框架，针对具有代表性的3个主流媒体倾向组（左，中，右）在2014年至今发布的2.2万份手动标记和180万份机器标记的新闻标题进行了超党派新闻标题检测的数据集开发，并在外部验证集上取得了0.84的准确度和0.78的F1得分；针对新闻标题中的党派性进行了计算分析，发现右翼媒体倾向于使用比例更高的超党派标题；通过逻辑回归模型和Shapley值确定了几个主题，并应用基于词库的语言分析工具对每个主题的标题进行了分析，发现左派、中派和右派媒体在外交、政治和社会问题方面的语言差异逐渐减小。

Jan, 2023

同样的词语，不同的意义：广播媒体语言中的语义极化与社交媒体讨论中的极化

本研究分析近十年来 CNN 和福克斯新闻的关闭字幕及 Twitter 上语篇信息，探讨语言表述在电视和社交媒体之间的关系，研究结果表明不同播出平台的语义极化现象与趋势出现了较大的差异，尤其是 2016 年之后，两个频道的讨论话题在语义上的差异越来越显著，这种语言上的分化在很大程度上塑造了 Twitter 上的语义互动。

Jan, 2023

社交媒体上的语言分歧演变

利用社交媒体数据，我们对美国党派的左右分歧进行语言分析，发现在话题、情感和词汇语义方面存在语言差异，并对可能导致语言分化的沟通问题提出警示。

Sep, 2023

诱导政治偏见使语言模型预测党派对争议的反应

通过使用大规模语言模型（LLMs）来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论，本研究创新性地采用了一个指导调整的LLM，以反映一系列政治意识形态。我们提出了一个综合的分析框架，包括党派偏见差异评估和党派倾向预测，以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性，但在立场检测方面存在一些挑战，突显了NLP工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示LLMs中细致的政治理解的可行性和重要性，特别适用于需要敏锐意识到政治偏见的应用，为该领域做出了重要贡献。

Nov, 2023

极化与道德：对Reddit关于堕胎话语的词汇分析

研究考察了政治话题上的分歧是否与语言使用的独特模式有关，收集了 Reddit 上关于堕胎辩论的总共145,832条评论，分析了 r/prolife 和 r/prochoice 的子版块社群中的语言使用。通过考虑道德基础理论，分析了三种词汇模式，包括计算道德基础词典中词汇项目的比例频率，创建 n-gram 模型以揭示各立场群体常用的词汇搭配，以及使用潜在狄利克雷分配来识别语料库数据中的主题结构。研究结果表明，道德词汇的使用与对堕胎的立场相关联。

Jun, 2024