基于机器学习算法的低碳节能旅游数据特征分析与挖掘
通过矩阵归一化,对四川 46 个关键行业 2000-2019 年的能源消耗数据进行预处理,使用 DBSCAN 聚类识别了 16 个特征类别,应用惩罚回归模型进行了能源数据复杂性的过拟合控制、高维数据处理和特征选择,并找出了二氧化碳排放量最高的第二类煤炭产业集群,也发现了与汽油和焦炭相关的排放显著。基于这一研究结果,提出了减排建议包括清洁煤技术、交通管理、钢铁中的煤电替代和行业标准化。总结来说,该研究通过 DBSCAN 和惩罚回归模型等算法确定了行业集群,评估了排放驱动因素,并提出了科学减排策略,以更好地为决策提供支持。
Sep, 2023
公交出行特征提取方法利用 POI 数据,采用增强的 P-KMENAS 和 P-LDA 算法来克服传统算法的局限性,有效地挖掘了与年龄、职业、性别、运动、费用、安全和个性特征等多个方面相关的公交出行行为,从而提升了公交出行的优化效果。
Dec, 2023
为了解为什么城市中心和郊区居民的出行行为不同,以可持续的城市规划为主旨。特别是在城市迅速增长的背景下,识别能够减少出行需求和 CO2 排放的住房位置对于缓解气候变化至关重要。尽管建筑环境起着重要作用,但对于出行行为的精确影响却被居民自我选择所掩盖。为了解决这个问题,我们提出了一种双重机器学习方法,通过控制居民自我选择,可以获得每个社区建筑环境对出行相关 CO2 排放的无偏空间显性估计。我们还研究了社会人口统计特征和与出行相关的态度如何调节这种影响,并对其在建筑环境的 5 个维度上进行了分解。基于柏林的实地案例研究和 3.2 万名居民的出行日记,我们发现建筑环境导致了柏林市中心和郊区社区之间家庭出行 CO2 排放几乎相差两倍。为了突出城市气候减缓的实际重要性,我们评估了 64,000 套新住宅单元的当前计划对总体诱导交通 CO2 排放的影响。我们的研究结果强调了在建筑发展方面空间差异化紧凑型发展的重要性,以减少运输领域的碳排放。
Dec, 2023
通过使用智能电表数据推导的负荷曲线,在实际案例研究中,我们提出了一种新颖的基于机器学习的框架,以实现通过适用于伦敦近 5000 个家庭的数据从而获得最佳负荷剖析。我们应用了四种广泛使用的聚类算法:K-means、K-medoids、层次凝聚聚类和基于密度的空间聚类。通过经验分析和多个评估指标来评估这些算法,并将问题重新定义为概率分类问题,并借助可解释的 AI(xAI)来提高解决方案的可解释性。根据聚类算法的分析,此案例的最佳聚类数为七个,但是我们的方法表明其中两个聚类,约占数据集的 10%,存在显着的内部差异,因此我们将其进一步划分为总共九个聚类。我们的解决方案具有可扩展性和多功能性,使其成为希望为用户细分以创建更有针对性的需求响应计划的电力公用事业公司的理想选择。
Oct, 2023
通过交叉轨迹特征工程和聚类,该研究利用高阶特征从人类移动轨迹记录中挖掘用户的生活方式特征,并且通过深入提取包括旅行模式、离散傅里叶变换的节奏和 word2vec 词向量化地点语义等特征,在深圳超过 50 万用户的轨迹数据集上,得到了七个具有不同生活方式特征的用户类簇,这些结果通过常识解释得到了很好的验证。
Dec, 2023
介绍了一种将自组织映射和 K 均值聚类相结合的新方法来有效聚类月度能源消耗模式,通过该方法可以增强难以找到模式的数据集的聚类结果的准确性和可解释性。实验证明了该方法在聚类任务中的有效性。
Nov, 2023
本文提出了一种基于机器学习的方法,以解决设计师在优化城市土地利用规划方面缺乏优化交通出行需求能力的问题。研究表明,我们的计算模型可以帮助设计师快速获得有关交通出行需求的反馈,包括总量和时间分布,这是基于设计师设计的城市功能分布。它还有助于从交通出行的角度进行设计优化和评估城市功能分布。我们通过收集城市兴趣点(POI)数据和在线车辆数据获取城市功能分布信息和车辆行驶时间(VHT)信息。选择了预测性能最好的人工神经网络(ANNs)。通过使用不同地区收集的数据集进行相互预测,并将预测结果重新映射到地图上进行可视化,我们评估了计算模型在不同地区的使用程度,以减轻未来城市研究人员的工作负担。最后,我们展示了计算模型在帮助设计师获取建筑环境中交通出行需求的反馈方面的应用,并与遗传算法相结合来优化当前城市环境的状态,为设计师提供建议。
Nov, 2023
本研究利用多种模型,探索基于用户偏好和行程特征(如成本、时间、出行目的和距离)的最佳交通方式,在实际生活中得到的数据支持下,研究发现使用梯度加速树模型结合少数类过采样技术(SMOTE)的表现最为突出,而在对数模型中可以看出:(1)交通成本增加会降低各种交通方式的效用;(2)对于地铁或多模式选项(包含地铁)人们对于出行距离有较高的容忍度,说明地铁线路可能是大城市最佳候选方案。
Oct, 2019
采用因果机器学习(CausalML)统计方法,研究了电力定价政策对家庭部门二氧化碳(CO2)水平的影响。该研究挑战了关于基于激励的电力定价的传统观念,发现采用此类政策可能无意中增加 CO2 强度。此外,研究还整合了基于机器学习的元算法,以增强因果分析的深度。研究对学习者 X、T、S 和 R 进行了比较分析,以确定基于所定义问题的目标和背景细微差别的最优方法。这项研究为关于可持续发展实践的持续对话提供了有价值的见解,强调了在政策制定中考虑意外后果的重要性。
Mar, 2024
决策行为是交通规划中的关键问题,传统的统计学习方法在预测性能方面存在局限性,机器学习模型在交通规划者中备受关注。然而,机器学习模型的黑箱特性限制了其在决策和政策制定中的实际应用。本研究使用了低收入和低中等收入家庭的数据集,采用了多项式逻辑模型和机器学习分类器,通过特征重要性和个体条件期望图解释了决策行为。研究结果表明,机器学习模型中的随机森林模型具有最佳的准确性,而旅行成本的增加会显著降低公交出行的概率,而旅行时间的减少则增加对地铁的偏好。这项研究扩展了使用机器学习技术进行模式选择分析的研究,并有助于提高对这些模型在真实数据方面的理解,包括准确性和可解释性。
Jan, 2024