Oct, 2012
社交媒体中的性别认同与词汇变化
Gender identity and lexical variation in social media
David Bamman, Jacob Eisenstein, Tyler Schnoebelen
TL;DR本文通过 Twitter 用户语言风格和社交网络之间的关系,探讨了性别、语言风格和社交网络之间的关系,提出了一种细致的性别分类方法,发现语言风格与社交网络之间的同性别联系紧密相关。
Abstract
We present a study of the relationship between gender, linguistic style, and
social networks, using a novel corpus of 14,000 →
发现论文,激发创造
推特语言模式的社会经济依赖性:多元分析
探讨了社会语言学的核心问题,即在全球范围内,个体的语言变异是受许多外部因素影响的,并利用法国最大的推特文本数据集和详细的社会经济地图,研究表明人们的社会经济地位、地理位置和社交网络等因素都对个体网络文本数据中的语言变量有显著影响。
Apr, 2018
利用社会语言学变量揭示性取向和性别态度的变化
本文研究了在美国社会语言学的词汇选择中关于同性恋和性别的态度变化,通过在 Twitter 和 Reddit 上对 8700 万条消息的纵向分析,发现态度正在发生变化但是这些变化是由特定人口群体驱动的,并且在溯因分析中表明不同州的婚姻平等法案是语言变化的推动因素。
Sep, 2021
识别涉黑社交媒体通讯时理解词汇偏见
该研究使用自然语言处理工具有效地识别使用社交媒体发布带有团伙暴力内容的个人,并提出了如何监测和识别这些个人需要帮助的方法,并讨论了使用机器学习模型和大数据方法所需考虑的语言对模型性能和群体歧视的影响。
Apr, 2023
从语言中自动推断性别联想
本研究通过语言自动推断性别关联发现单词聚类,并针对其所代表的语义概念进行标记,并比较了两个不同领域写作中人们如何谈论妇女和男子之间的差异,证明了人们谈论妇女和男子的方式存在大规模差异,并且这些差异在不同领域中有所不同。
Aug, 2019
ArabGend:基于阿拉伯语推特的性别分析与推断
本研究旨在探究阿拉伯语 Twitter 上男女用户在参与度、兴趣点、职业领域等方面的差异,并通过用户名、头像、推文及好友网络等方式进行性别推断,达到了 82.1% 的 F1 分数,同时也开发了一个可公开使用的演示版。
Mar, 2022
基于潜变量建模的无监督发现性别化语言
本文介绍了一种生成潜在变量模型,用于量化形容词(或动词)选用及其情感,并以头(或依赖)名词的自然性别为条件。研究发现男女名词描述之间存在显著差异,并且这些差异与常见的性别刻板印象相一致:用于描述女性的积极形容词更与其身体相关而不是用于描述男性的形容词。
Jun, 2019