Jul, 2023

多模态调查和地球观测数据预测贫困率

TL;DR通过结合家庭人口统计和生活水平调查问题以及从卫星图像中提取的特征,预测一个地区的贫困率。我们的方法利用 10 米每像素的 Sentinel-2 地表反射卫星图像,并使用单步特征化方法获得视觉特征。这些视觉特征与十个调查问题结合在一起,通过代理手段测试(PMT)来估计一个家庭是否处于贫困线以下。我们证明了加入视觉特征可以将贫困率估计的均方误差从 4.09% 降低到 3.88%。除了将卫星图像特征包含在代理手段测试中,我们还提出了一种选择与从卫星图像中提取的视觉特征互补的一小部分调查问题的方法。具体来说,我们设计了一种由整个调查和图像特征引导的调查变量选择方法,并使用该方法确定一小组最相关的调查问题,以纳入代理手段测试中。我们验证了这些小调查问题的选择,在使用这小组问题预测贫困率的下游任务中表现最佳,贫困率的误差从 4.09% 降低到 3.71%。我们还证明了提取的视觉特征编码了地理和城市化之间的差异。