Feb, 2024

提高货运模式选择模型的准确性:基于 2017 年 CFS PUF 数据集和集成学习技术的研究案例

TL;DR使用 2017 年商品流动调查的公共数据集,构建了一个高性能货物运输方式选择模型,提出了三个主要改进:针对每个独立的商品 / 行业类别构建本地模型,提取有用的地理特征,尤其是起始 / 目的地区域之间每种货运方式的派生距离,并应用附加的集成学习方法来结合本地和统一模型的结果,以提高性能。该方法在不引入外部信息的情况下实现了 92% 以上的准确度,相比在 10000 个样本上直接拟合随机森林模型,提高了 19% 以上。此外,使用 SHAP 值解释了所提模型的输出和主要模式。该模型框架可以增强现有货物运输方式选择模型的性能和可解释性。