面向目标特定立场的嵌入式聚类:以极化的土耳其为例
社交媒体用户通过与其他用户的互动、自发声明或参与网络社区表达其政治偏好,因此像 Twitter 这样的社交网络是研究计算科学方法在政治学习推理方面的宝贵数据源。本研究聚焦于西班牙的三个多样化地区(巴斯克地区、加泰罗尼亚和加利西亚),探索用于分析不断演变和复杂的政治格局所需的多党分类的各种方法,并将其与二元左右派方法进行比较。我们采用两步法,通过从转发中获取的无监督用户表示来进行政治倾向检测。对于由标记用户及其互动组成的新收集和筛选数据集的全面实验证明,将关系嵌入作为政治意识形态检测的表示方法,在有限的训练数据下,在二元和多党框架中都具有有效性。最后,数据可视化展示了关系嵌入捕捉复杂的组内和组间政治共鸣的能力。
Jun, 2024
该研究提出了一种利用 Twitter 时间轴内容分析的非监督态度检测框架 (Tweets2Stance) 来预测社交媒体用户态度的方法,并通过对六个政党在 20 个不同议题上的一致性进行分析,依据党派帐号的言论预测政治主张。结果表明,T2S 能以最小 MAE 为 1.13 的准确度成功检测用户的态度。
Apr, 2022
本文介绍了一种高度有效的非监督式框架,用于检测 prolific Twitter 用户对有争议话题的立场。该框架利用降维和聚类来找到不同立场的代表性核心用户,无需标记用户,可以在几秒钟或几分钟内进行手动标记,并且对于数据偏度具有鲁棒性。
Apr, 2019
通过两个机器学习模型的优势相结合,我们提出了一个混合模型来检测竞选负面情绪,利用推特等社交媒体平台的数据分析候选人和政党的策略。通过分析 50 位政治用户在伊朗总统选举前一年内发布的 5,100 条推文,我们的最佳模型(RF-RF)在宏观 F1 分数上达到 79%,加权 F1 分数达到 82%。我们发现推文的发布与其负面情绪无关,与政治人物和政治组织的名称直接相关。
Oct, 2023
研究发现,使用社交媒体平台的用户只需发表 13 篇与社会相关的帖子即可预测其政治取向,作者通过创新的半自动化方法来发现用户的政治倾向,并公开了波兰的 POLiTweets 数据集,以研究多党制的政治倾向和领域转移等问题。
Jun, 2022
本论文采用词袋和 ParsBERT 进行机器学习和深度学习模型分析波斯语政治推文的情感,结果表明,使用 ParsBERT 嵌入的深度学习模型优于机器学习模型,在第一组具有三个类别的数据集上,CNN-LSTM 模型的分类精确度最高,达到 89%,在第二组具有七个类别的数据集上,分类精度为 71%,由于波斯语的复杂性,此研究的效率相对较低。
Jul, 2023
本文分析了加纳选民在 2020 年总统选举期间在 Twitter 上发布的推文,并使用机器学习方法对推文进行分类和评估,结果显示逻辑回归是最佳表现方法。
Jun, 2023
本文提出了一种基于 NLP 的框架,通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面,并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对 21 起大规模枪击事件中的 4.4M 条推文进行研究,发现这些事件的讨论在政治上高度极化。结果表明,共和党更关注枪手和事件特定事实,而民主党则更关注受害者和政策变化的呼吁。同时,作者还发现了一些引导言论极化的表达方式,诸如 “基础事实” 以及 “恐怖分子” 和 “疯子” 这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法,并提供了计算方法来研究这些现象。
Apr, 2019
本研究使用基于 BERT 的模型分析推特上关于俄乌战争的观点和情感,采用邻域平均法模拟和聚类各国家时间序列,并提供有关公众对此冲突看法的有价值的见解。
Jan, 2023