无监督深度学习对社交媒体上政治倾向的精细预测
通过使用新闻媒体偏见和帖子内容来标记社交媒体帖子的两种启发式方法,以及与随机抽取的人工标注数据集进行比较,我们展示了当前机器学习模型在预测社交媒体帖子的政治倾向方面的改进性能,采用传统的监督学习和少样本学习设置。
Nov, 2023
社交媒体用户通过与其他用户的互动、自发声明或参与网络社区表达其政治偏好,因此像 Twitter 这样的社交网络是研究计算科学方法在政治学习推理方面的宝贵数据源。本研究聚焦于西班牙的三个多样化地区(巴斯克地区、加泰罗尼亚和加利西亚),探索用于分析不断演变和复杂的政治格局所需的多党分类的各种方法,并将其与二元左右派方法进行比较。我们采用两步法,通过从转发中获取的无监督用户表示来进行政治倾向检测。对于由标记用户及其互动组成的新收集和筛选数据集的全面实验证明,将关系嵌入作为政治意识形态检测的表示方法,在有限的训练数据下,在二元和多党框架中都具有有效性。最后,数据可视化展示了关系嵌入捕捉复杂的组内和组间政治共鸣的能力。
Jun, 2024
该研究介绍了一种基于自我注意力半监督框架的政治倾向检测方法,通过对社交媒体上公开可用的数据进行解释,可以低成本、无涉及相关人员的方式收集可控的调查人群的见解,并获得 93.7% 的准确性,具有高效性和可拓展性。
Sep, 2022
开发了一种机器学习分类器,通过社交媒体上的非政治文本和用户关注的账户来推断政治取向,并发现新闻分享存在鲜明的左右分化,而体育新闻则不具有政治倾向性。
Aug, 2022
利用可靠的外部数据资源学习新闻文章的公正表示,提出了一种知识注入的深度学习模型,旨在预测新闻文章的政治倾向,解决了现有学习模型在模型训练中受到新闻发布者的政治偏见影响的问题,从而消除了算法政治偏见,并在准确性方面优于基线方法,可达到 73% 的准确率。
Sep, 2023
研究发现,使用社交媒体平台的用户只需发表 13 篇与社会相关的帖子即可预测其政治取向,作者通过创新的半自动化方法来发现用户的政治倾向,并公开了波兰的 POLiTweets 数据集,以研究多党制的政治倾向和领域转移等问题。
Jun, 2022
通过使用大规模语言模型(LLMs)来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论,本研究创新性地采用了一个指导调整的 LLM,以反映一系列政治意识形态。我们提出了一个综合的分析框架,包括党派偏见差异评估和党派倾向预测,以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性,但在立场检测方面存在一些挑战,突显了 NLP 工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示 LLMs 中细致的政治理解的可行性和重要性,特别适用于需要敏锐意识到政治偏见的应用,为该领域做出了重要贡献。
Nov, 2023
本文提出了一个启发式方法来将社交媒体帖子分类为五个不同的政治倾向类别,通过在 Twitter 和 Gab 这两个具有不同政治意识形态的社交媒体数据集上利用现有时间序列预测模型,我们的工作旨在为预测社交媒体平台中的政治偏见的挑战和机会提供启示,最终要为在数字领域减轻政治偏见的负面影响开发更有效的策略铺平道路。
Sep, 2023
该研究提出了一种利用 Twitter 时间轴内容分析的非监督态度检测框架 (Tweets2Stance) 来预测社交媒体用户态度的方法,并通过对六个政党在 20 个不同议题上的一致性进行分析,依据党派帐号的言论预测政治主张。结果表明,T2S 能以最小 MAE 为 1.13 的准确度成功检测用户的态度。
Apr, 2022
本文从弱监督的角度,探讨 Facebook 中的政治广告立场、问题、以及地理、性别、年龄等不同人群的定向投放,并且分析了选举时期政治广告的时态动态。
Oct, 2022