BriefGPT.xyz
Apr, 2020
PANDORA Talks:Reddit 上的人格与人口统计
PANDORA Talks: Personality and Demographics on Reddit
HTML
PDF
Matej Gjurković, Mladen Karan, Iva Vukojević, Mihaela Bošnjak, Jan Šnajder
TL;DR
本文介绍了 PANDORA,一个 Reddit 评论数据集,包含超过10k个用户的三个人格模型(包括广为流传的大五人格模型)和人口统计学信息(包括年龄、性别和位置)。我们展示了此数据集在三个实验中的实用性,并为所有人格和人口统计变量提供基准预测模型。
Abstract
personality
and
demographics
are important variables in social sciences, while in
nlp
they can aid in intepretability and removal of socie
→