社交媒体揭示中国城乡压力差异
本研究调查了各性别和种族 / 民族组之间有关压力源的开放式文本反应和抑郁症状的关系,并使用主题模型和其他 NLP 工具发现了不同人口群体报告压力源时的主题和词汇差异,并使用自报压力源训练语言模型来预测抑郁症状,发现压力源和抑郁症状之间存在关系,并最终发现压力源的差异会导致不同人口群体的绩效差异。
Nov, 2022
通过对美国的 Twitter 和中国的新浪微博的比较研究,本文探讨了不同社交媒体平台上用户情感(两个主要维度为情感价值和情感唤起度)之间的差异,同时也研究了其关联的内容差异,并发现来自不同文化背景的用户对情感的表达方式存在明显差异,并从语言特征上解释了这些差异。
Jan, 2024
利用自然语言处理分析了十亿个字,来研究中国最大的社交媒体平台之一微博上的文化差异。比较了关于中国文化差异的两种常见解释(经济发展和城乡差异),并与不那么明显的稻谷种植与小麦种植的遗留影响进行对比。稻谷种植地区使用了更多反映紧密社会关系、整体性思维和谨慎、预防导向的词汇,从而测试这种遗留影响是否使中国南方更加相互依存。通过对日本的推特数据进行比较,得到了与中国几乎相同的结果,从而为稻谷理论提供了重要证据。
Aug, 2023
该研究应用自然语言处理技术对社交媒体数据进行分析,以确定 COVID-19 大流行期间的心理社会压力源,并分析各阶段压力源的流行趋势。结果可用于提供洞察力,以便为个人提供高质量的心理健康支持。
Jan, 2022
本文研究了在一国范围的公开社交媒体数据集中短暂行为特征对失业率影响的贡献程度,并发现表现出更多样化流动通量,更早时间的昼夜节律和更正确语法风格的地区显示更低的失业率,因此,我们提供了一个简单的模型,它能够仅通过社交媒体数据即可准确地可解释地重建地区失业率。
Nov, 2014
这篇论文介绍了一份新的文本语料库 Dreaddit,该语料库包含来自五个不同类别 Reddit 社群的 19 万条帖子,用于识别长篇社交媒体数据中的压力表征,并提出了基于监督学习的方法。
Oct, 2019
通过对美国各地实时表达和生活相关数据的大规模分析,探索了社交媒体作为估测肥胖率等人口水平的工具的潜力。
Feb, 2013
本研究通过比较自杀微博用户与非自杀用户在行为和语言特征上的差异,发现自杀人群在公开发布的帖子数量、自我提及程度、以及使用否定词、社会过程词、认知过程词、情感过程词、否定情感词、独有词和生理过程词方面显著突出,这一发现为构建网络预警系统和早期干预提供了指示。
Jul, 2014
本文旨在通过多种语言学、心理学及在线行为等多个方面,更好地了解患有心理障碍的社交媒体用户的特征和差异。研究结果表明,这些用户与正常用户相比,在词汇唯一性、情感表达和月度发布方差等方面存在明显差异。
Feb, 2022