Aug, 2023

我们应该相信网络抓取的数据吗?

TL;DR通过网页抓取收集数据的方法存在抽样偏差,本研究指出网页抓取数据存在抽样偏差的三个原因,并通过一系列实例揭示抽样偏差的普遍性和严重性,同时提供了关于如何预测、检测和克服抽样偏差的建议。