使用词嵌入法测量议题所有权

Oct, 2018

Measuring Issue Ownership using Word Embeddings

Amaru Cuba Gyllensten, Magnus Sahlgren

TL;DR本文介绍了一种另类的社交媒体监控方法，探讨了政治学概念中的议题所有权和议程设置，并提出了一种新的条件相似性测量方法，使用词/文档嵌入技术测量政治相关媒体与政党之间的相似度。

Abstract

Sentiment and topic analysis are common methods used for social media monitoring. Essentially, these methods answers questions such as, "what is being talked about, regarding X", and "what do people feel, regarding X". In this paper, we investigate another venue for →

发现论文，激发创造

在社交媒体中分析极化趋势：以21起大规模枪击事件中的推文为例

本文提出了一种基于NLP的框架，通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面，并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对21起大规模枪击事件中的4.4M条推文进行研究，发现这些事件的讨论在政治上高度极化。结果表明，共和党更关注枪手和事件特定事实，而民主党则更关注受害者和政策变化的呼吁。同时，作者还发现了一些引导言论极化的表达方式，诸如“基础事实”以及“恐怖分子”和“疯子”这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法，并提供了计算方法来研究这些现象。

Apr, 2019

社交媒体中政治关注的两种计算模型

本文介绍了两个计算模型，一个是有监督分类器，一个是无监督主题模型，以自动区分政界人士在社交媒体上发布的内容的话题，是政治传播和社交媒体研究的有效、廉价的计算工具。

Sep, 2019

通过意识形态膨胀主题相关性：社交主题检测模型中的政治意识形态偏见案例研究

本文研究了训练数据中的政治意识形态偏见对自然语言处理模型的影响，发现大而复杂的模型容易从人选择的输入中传播偏差，从而导致检索准确性的恶化。最后，我们提出一种方法来减轻这种偏差，即学习一个对政治意识形态不变但仍然可以判断主题相关性的文本表示。

Nov, 2020

通过情境化言语处理理解政治

本研究利用组合式阅读器模型对具有不同事件的多篇文档进行分析，以捕获并利用政治实体对特定事件所持的内在议程，从而形成多个实体、问题或事件的有效表征，通过定量和定性分析表明该模型是有意义和有效的。

Dec, 2020

社会偏见媒体表示准确度的评估：没有完美的单词嵌入模型

通过分析500k篇美国在线新闻文章中存在的社会偏见类型，使用考虑了嵌入表示问题的多种算法以及WEAT，比较了这些算法在新闻文章中训练的模型所表示的期望社会偏见，结果发现标准偏差检测方法与心理学知识并不一致，而新提出的算法虽然减轻了这种差距，但仍然无法完全匹配这些文献。

Nov, 2022

使用语义相似性和文本嵌入测量战略传播的社交媒体回响

本文提出了一种利用语义相似性量化特定信息发布后讨论变化的新技术，并使用环保组织的新闻稿和气候变化辩论的推文来展示我们的新方法揭示了在线话语对战略传播的不同响应规律。

Mar, 2023

机器学习和统计方法用于衡量政党相似度

采用自然语言处理技术中的大型变形器模型，对政党政治纲领进行相似度测量，并分析它们与专家调查、选民投票记录及候选人网络等指标的相关性，考虑了这种方法替代专家判断的前景。

Jun, 2023

政治信息源的知识图谱表示

本文通过11.5年的数据分析，从知识图谱角度证明了特定信息传播导致回音室的形成不仅与集体拓扑结构有关，还与个体信息消费方式相关，并且信息源的相对‘内部’中立性及对少数实体的极化态度可能引发听众世界观的根本差异性。

Apr, 2024

揭示议程：一个用于社交媒体议程检测的新型法英数据集

通过使用以2022年法国总统选举为中心的推特信息集，本文提出了一种用于检测社交媒体上特定议程控制实例的方法，该方法适用于注释数据有限或不存在的情况，并通过评估不同方法和技术的全面性展示了其可行性，证明将任务视为文本蕴涵问题可以克服对大规模注释训练数据集的需求。

May, 2024

通过多民族场景推断政治倾向

社交媒体用户通过与其他用户的互动、自发声明或参与网络社区表达其政治偏好，因此像Twitter这样的社交网络是研究计算科学方法在政治学习推理方面的宝贵数据源。本研究聚焦于西班牙的三个多样化地区（巴斯克地区、加泰罗尼亚和加利西亚），探索用于分析不断演变和复杂的政治格局所需的多党分类的各种方法，并将其与二元左右派方法进行比较。我们采用两步法，通过从转发中获取的无监督用户表示来进行政治倾向检测。对于由标记用户及其互动组成的新收集和筛选数据集的全面实验证明，将关系嵌入作为政治意识形态检测的表示方法，在有限的训练数据下，在二元和多党框架中都具有有效性。最后，数据可视化展示了关系嵌入捕捉复杂的组内和组间政治共鸣的能力。

Jun, 2024