Twitter 上 #greysanatomy 与 #yankees 的人口统计和 hashtag 使用情况
通过 #BlackLivesMatter 运动及 Twitter 上的 hashtag,本文旨在衡量种族、性别、年龄等用户类型的人口偏见,并探讨研究敏感主题的伦理警示。
Dec, 2015
本文提出了一种基于识别 Twitter 个人资料描述自我报告种族和族裔的方法,以解决目前原有数据集较小、不准确或未覆盖美国四个最常见的种族和族裔群体的问题,有效提供了一个可复现的大规模培训种族和族裔判别系统的资源。
May, 2020
通过分析 Twitter 数据,研究表明基于互联网社交媒体平台上的行为可以显示个体的心理健康状况。先前的研究引发了有关模型偏差的担忧,这项研究分析了基于 Twitter 数据训练的抑郁症分类器在不同人口群体(如性别和种族 / 民族群体)中的公平性,发现模型性能在代表人群中系统性差异,这些差异不能完全通过数据表示问题来解释,研究最终提出了如何避免这些偏差的建议。
Mar, 2021
提出了一种基于地理位置标记推特的计算方法,能够以细微的地理分辨率、灵活的地理边界与不同时间间隔推测人口统计学数据,通过对性别、种族 / 族裔等因素的预测,超越了传统方法的平均相关性。
Jan, 2017
本文对 Instagram 上分享的 hashtag 进行了首次大规模实证分析,揭示了从时空、语义和社会维度出发的一系列发现,其中包括时序模式可划分为四个不同群集、语义位移较大的 hashtag 有不可忽略的比例、用户分享较均匀的 hashtag 不易语义位移。最后,作者提出了一个双向图嵌入模型以总结用户的 hashtag 概要,并基于这些概要进行好友预测,证明 hashtag 具有强大的社交信号。
May, 2019
使用机器学习技术开发了一个社会泛指的自动分类器,并将其应用于超过一百万条关于人的推文进行分析,发现社会泛指的推文获得更多点赞和转发,且与政治团体相关的泛指推文比与民族团体相关的泛指推文更常见,而针对政治团体的负面泛指推文比针对民族团体的负面推文更多,并且更常被转发;我们的研究首次基于机器学习揭示了社会泛指在 Twitter 上的使用和影响。
May, 2024
通过对美国各地实时表达和生活相关数据的大规模分析,探索了社交媒体作为估测肥胖率等人口水平的工具的潜力。
Feb, 2013
在超过 256,000 个不同用户所发的 60 万多条推特分析中,对于 #MeToo 的在线讨论提取出女性种族 / 民族的差异,探讨它们对于帮助那些长期被忽视的人提高声音的作用,并强调数字行动主义研究和设计的重要性以提高代表性和平等。
Oct, 2020
本文研究了 2016 年美国总统竞选中两名主要候选人唐纳德・特朗普和希拉里・克林顿的追随者人口统计学数据。我们使用数据集 US2016,分析了追随者人口的社会地位、性别、种族和年龄四个方面。研究表明在社会影响力方面,特朗普的追随者更加极端化,也比克林顿的追随者更有影响力。此外,与克林顿的追随者相比,特朗普的追随者更可能是非常年轻或非常老。该研究未发现克林顿在 Twitter 领域中存在性别亲和性,但发现克林顿的追随者种族更加多样化。
Mar, 2016
我们构建、验证和公开发布了包括用户数据、文本和图像的具有代表性的 DADIT 数据集,用于研究社交媒体用户的性别和年龄预测模型,并发现采用基于 XLM 的分类器结合推文作为特征可以显著提高性别和年龄的预测效果。
Mar, 2024