Mar, 2018

计算社会科学中的卖方注意:广泛发布的 Reddit 语料库存在大规模缺失数据

TL;DR对 Reddit 数据集的研究发现其存在缺失严重的问题,对于用户历史或网络分析研究存在很大风险,但对于避免代表性行为和参与的机器学习研究存在较小风险。