加泰隆尼亞獨立與社交媒體上的語言身分
社交媒体用户通过与其他用户的互动、自发声明或参与网络社区表达其政治偏好,因此像 Twitter 这样的社交网络是研究计算科学方法在政治学习推理方面的宝贵数据源。本研究聚焦于西班牙的三个多样化地区(巴斯克地区、加泰罗尼亚和加利西亚),探索用于分析不断演变和复杂的政治格局所需的多党分类的各种方法,并将其与二元左右派方法进行比较。我们采用两步法,通过从转发中获取的无监督用户表示来进行政治倾向检测。对于由标记用户及其互动组成的新收集和筛选数据集的全面实验证明,将关系嵌入作为政治意识形态检测的表示方法,在有限的训练数据下,在二元和多党框架中都具有有效性。最后,数据可视化展示了关系嵌入捕捉复杂的组内和组间政治共鸣的能力。
Jun, 2024
探讨了社会语言学的核心问题,即在全球范围内,个体的语言变异是受许多外部因素影响的,并利用法国最大的推特文本数据集和详细的社会经济地图,研究表明人们的社会经济地位、地理位置和社交网络等因素都对个体网络文本数据中的语言变量有显著影响。
Apr, 2018
使用地理标记微博数据集对西班牙语言的地区变体进行了大规模分析,发现该语言分为两个超级方言,包括城市语言和更具区域特色的农村和小城镇语言的不同形式。
Jul, 2014
本研究分析希腊,西班牙和英国国会议员的 Twitter 帖子,通过情感分析探索这些政治家的帖子是否遵循推广负面情绪以获得更高转发量的趋势,结果表明政治家的负面情绪的推文在最近时间内更广泛传播,突显情感和受欢迎程度的交集方面的有趣趋势。
Feb, 2022
通过研究 62000 名乌克兰公民在 2020 年 1 月至 2022 年 10 月期间发表的 400 多万条限地标志的推特信息,使用统计模型研究了语言选择和推文活动,并确定了行为效应和样本效应。研究表明,随着乌克兰局势的变化,从俄语向乌克兰语转变的趋势加快。
May, 2023
本文通过 Twitter 用户语言风格和社交网络之间的关系,探讨了性别、语言风格和社交网络之间的关系,提出了一种细致的性别分类方法,发现语言风格与社交网络之间的同性别联系紧密相关。
Oct, 2012
本文研究了三种自动语言识别方法与 Twitter 用户界面语言设置和语言人工编码之间的可靠性,比较了用户输入的个人资料位置与实际发推地点之间的不同,证明了用户生成的资料位置无法用作推特信息发布的有用代理。
Aug, 2013
研究发现,使用社交媒体平台的用户只需发表 13 篇与社会相关的帖子即可预测其政治取向,作者通过创新的半自动化方法来发现用户的政治倾向,并公开了波兰的 POLiTweets 数据集,以研究多党制的政治倾向和领域转移等问题。
Jun, 2022