Jan, 2024

应用机器学习进行空气质量预测:全球视角与对低资源环境的相关性

TL;DR本研究利用两个月的空气质量数据,通过提出一种新颖的机器学习方法,在全球 197 个首都的世界天气数据库中运用气象、空气污染物和空气质量指数特征,预测下一天的空气质量。通过评估多个机器学习模型,证明了随机森林算法在分类而非回归应用时可靠性预测的有效性,模型的泛化能力提高了 42%,回归交叉验证得分为 0.38,分类交叉验证得分为 0.89。研究还考虑了可解释的机器学习,给出了在高资源和低资源环境中实施该解决方案的成本估算及技术许可商业模式的初步尝试。该研究突出了资源有限国家在等待更大数据集以进一步改进预测能力之际,自主预测空气质量的潜力。