使用词嵌入法测量议题所有权
本文提出了一种基于NLP的框架,通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面,并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对21起大规模枪击事件中的4.4M条推文进行研究,发现这些事件的讨论在政治上高度极化。结果表明,共和党更关注枪手和事件特定事实,而民主党则更关注受害者和政策变化的呼吁。同时,作者还发现了一些引导言论极化的表达方式,诸如“基础事实”以及“恐怖分子”和“疯子”这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法,并提供了计算方法来研究这些现象。
Apr, 2019
本文介绍了两个计算模型,一个是有监督分类器,一个是无监督主题模型,以自动区分政界人士在社交媒体上发布的内容的话题,是政治传播和社交媒体研究的有效、廉价的计算工具。
Sep, 2019
本文研究了训练数据中的政治意识形态偏见对自然语言处理模型的影响, 发现大而复杂的模型容易从人选择的输入中传播偏差,从而导致检索准确性的恶化。最后,我们提出一种方法来减轻这种偏差,即学习一个对政治意识形态不变但仍然可以判断主题相关性的文本表示。
Nov, 2020
本研究利用组合式阅读器模型对具有不同事件的多篇文档进行分析,以捕获并利用政治实体对特定事件所持的内在议程,从而形成多个实体、问题或事件的有效表征,通过定量和定性分析表明该模型是有意义和有效的。
Dec, 2020
通过分析500k篇美国在线新闻文章中存在的社会偏见类型,使用考虑了嵌入表示问题的多种算法以及WEAT,比较了这些算法在新闻文章中训练的模型所表示的期望社会偏见,结果发现标准偏差检测方法与心理学知识并不一致,而新提出的算法虽然减轻了这种差距,但仍然无法完全匹配这些文献。
Nov, 2022
本文提出了一种利用语义相似性量化特定信息发布后讨论变化的新技术,并使用环保组织的新闻稿和气候变化辩论的推文来展示我们的新方法揭示了在线话语对战略传播的不同响应规律。
Mar, 2023
采用自然语言处理技术中的大型变形器模型,对政党政治纲领进行相似度测量,并分析它们与专家调查、选民投票记录及候选人网络等指标的相关性,考虑了这种方法替代专家判断的前景。
Jun, 2023
本文通过11.5年的数据分析,从知识图谱角度证明了特定信息传播导致回音室的形成不仅与集体拓扑结构有关,还与个体信息消费方式相关,并且信息源的相对‘内部’中立性及对少数实体的极化态度可能引发听众世界观的根本差异性。
Apr, 2024
通过使用以2022年法国总统选举为中心的推特信息集,本文提出了一种用于检测社交媒体上特定议程控制实例的方法,该方法适用于注释数据有限或不存在的情况,并通过评估不同方法和技术的全面性展示了其可行性,证明将任务视为文本蕴涵问题可以克服对大规模注释训练数据集的需求。
May, 2024
社交媒体用户通过与其他用户的互动、自发声明或参与网络社区表达其政治偏好,因此像Twitter这样的社交网络是研究计算科学方法在政治学习推理方面的宝贵数据源。本研究聚焦于西班牙的三个多样化地区(巴斯克地区、加泰罗尼亚和加利西亚),探索用于分析不断演变和复杂的政治格局所需的多党分类的各种方法,并将其与二元左右派方法进行比较。我们采用两步法,通过从转发中获取的无监督用户表示来进行政治倾向检测。对于由标记用户及其互动组成的新收集和筛选数据集的全面实验证明,将关系嵌入作为政治意识形态检测的表示方法,在有限的训练数据下,在二元和多党框架中都具有有效性。最后,数据可视化展示了关系嵌入捕捉复杂的组内和组间政治共鸣的能力。
Jun, 2024