非洲二级行政区外国直接投资的大数据分析方法
本研究采用包含 35 亿辆车辆出入收费系统记录的大规模数据集,通过交通网络分析来建立中距离陆路交通模式与区域经济地位的相关性,利用标准复杂网络的测量方法,分析公路交通网络的一组交通流特征并将其与城市 GDP 指标相关联,建立了多元线性回归模型,从而解释了中国三个省市城市 GDP 变化的 89%至 96%,我们采用双城市年度交通量拟合重力模型,发现距离衰减效应的时变特征与不同省份的经济发展模式相关联,结论是交通大数据揭示了区域经济发展的现状,同时也包含了区域管理和规划所需的人员流动、生产联系和物流等有价值的信息。
Feb, 2020
该研究介绍了利用开放源代码的地理定位维基百科文章中的文本信息,运用现代 NLP 技术,预测社区层面的资产财富和教育成果的新方法,提高普查数据收集的成本效益,优于先前的数据预测基准,能为社会科学研究和政策决策提供参考。
May, 2019
通过对非洲国家的地理标记的 Flickr 图像进行大规模分析,研究表明标准的互联网数据收集方法在低收入和中等收入国家存在局限性,需要进一步努力来捕捉非洲人和他们环境的图像数据,以改善计算机视觉模型在全球范围内的适用性。
Aug, 2023
本文旨在研究 1990-2022 年间印度农村地区的贫困情况,使用生活质量和生计指标将地区分为 “先进”、“赶超”、“落后” 和 “滞后”,整合各种数据来源分析贫困情况,尤其针对性地关注弱势人群以减少不平等现象。
Apr, 2023
本文探讨了非洲数据分享景观面临的问题,包括由殖民主义,种族中心主义和奴隶制制造的权力不平衡,缺乏建立信任的投资,历史和现代剥削实践的缺乏承认以及不适用于非洲背景的西方中心政策,并提出解决这些问题的途径。
Mar, 2021
运用社交媒体和统计模型,本研究分析了纽约市的推文,发现性别、族裔、邻里交通等因素会影响个人对交通可达性的认知,而亚洲族裔和空气污染也与社会经济不平等有关。然而,对于弱势群体而言,缺乏网络可访问性可能是不善于表达交通可达性问题的原因之一。
Jan, 2024
本文运用 GDELT 项目所收集的大规模新闻报道数据集,通过分层(混合效应)回归模型,揭示了全球灾难新闻报道的结构及其决定因素。结果表明许多变量,例如人口数量、政治稳定性和灾害破坏程度等,与既有研究趋势一致。同时,强烈的地域主义发现强调了进行全球新闻报道研究的综合性数据集的必要性。
Oct, 2014
通过对马达加斯加的研究,我们发现宏观经济因素对可再生能源消费具有最大的影响力,其中国内投资、外商直接投资和通货膨胀对可再生能源的采用起到积极作用,而工业发展和贸易开放对可再生能源消费产生了负面影响。
Oct, 2023
本文研究了在一国范围的公开社交媒体数据集中短暂行为特征对失业率影响的贡献程度,并发现表现出更多样化流动通量,更早时间的昼夜节律和更正确语法风格的地区显示更低的失业率,因此,我们提供了一个简单的模型,它能够仅通过社交媒体数据即可准确地可解释地重建地区失业率。
Nov, 2014
该研究基于 Vkontakte 社交网络的非结构化数据,利用 BERT 神经网络分析了通货膨胀趋势,提供了关于地区通货膨胀过程的额外运营信息。该方法可以扩展到其他地区,但是也受到了为所有俄罗斯地区进行初始模型培训的时间和计算资源的限制。
Feb, 2024