一种基于混合 SOM 和 K-means 模型的时间序列能耗聚类
通过使用智能电表数据推导的负荷曲线,在实际案例研究中,我们提出了一种新颖的基于机器学习的框架,以实现通过适用于伦敦近 5000 个家庭的数据从而获得最佳负荷剖析。我们应用了四种广泛使用的聚类算法:K-means、K-medoids、层次凝聚聚类和基于密度的空间聚类。通过经验分析和多个评估指标来评估这些算法,并将问题重新定义为概率分类问题,并借助可解释的 AI(xAI)来提高解决方案的可解释性。根据聚类算法的分析,此案例的最佳聚类数为七个,但是我们的方法表明其中两个聚类,约占数据集的 10%,存在显着的内部差异,因此我们将其进一步划分为总共九个聚类。我们的解决方案具有可扩展性和多功能性,使其成为希望为用户细分以创建更有针对性的需求响应计划的电力公用事业公司的理想选择。
Oct, 2023
本文介绍了如何利用基于自组织映射(Self-Organizing Maps,SOM)的聚类方法来分析近期产生的空间物理过程的大量仿真和观测数据,并得出了聚类图,该图可以很好地定位整个过程中各个区域的特征,因此该方法是一种有前途的数据分析工具,可以用于空间物理过程的仿真和观测数据的分析。
Apr, 2023
通过比较四种聚类技术的性能,本研究旨在实现在监督学习任务中强大的混合模型。使用来自西班牙加利西亚卢戈 Xermade 的一个实验性风电场上的生态气候房屋 Sotavento 的实际数据集进行研究,选择了热太阳能发电系统,应用多种聚类方法和回归技术来预测系统的输出温度,并采用了三个无监督学习度量标准(Silhouette、Calinski-Harabasz 和 Davies-Bouldin)和多层感知器等回归算法的常见误差度量标准来定义每种聚类方法的质量。
Feb, 2024
通过机器学习算法对低碳出行数据进行特征分析和挖掘,本研究旨在研究居民低碳意识形成机制,为交通管理者引导城市居民选择低碳出行方式提供重要依据。实验结果表明,居民低碳出行意愿可分为三类:强烈、中立和不强烈;而职业、居住地、家庭结构和通勤时间是最重要的因素之一。该方法从多个方面为城市交通低碳的发展和管理提供政策建议。
Dec, 2023
在这篇论文中,描述了城市交通模式聚类的两个重要应用:第一个应用程序通过使用具有相似交通模式的道路段的速度来给地图块上色以估计缺失的速度值。第二个应用程序是使用不同道路段的相似模式来生成地图上某个当地点的地址所需的基本道路段的估计。本文提出了基于 K-Means 和动态时间规整的时间序列聚类算法。我们提出的算法的案例研究基于 Snapp 应用程序的司机速度时间序列数据。这两个应用程序的结果表明,所提出的方法能够提取相似的城市交通模式。
Sep, 2023
本研究提出了一种利用退火机的新型时间序列聚类方法,对时间序列数据进行分类的同时,具有去除异常值的鲁棒性。与现有的聚类方法相比,该方法在分类结果上获得了更好的表现。
May, 2023
制造业能源消耗数据中包含了操作可见性和诊断所需的重要过程特征。本研究通过引入一种层次化机器学习方法,从不同时间尺度(每周和每日)的涂装厂用电数据中识别汽车生产过程特征。我们使用多层感知机(MLP)、卷积神经网络(CNN)以及主成分分析(PCA)结合逻辑回归(LR)进行分析。验证了所开发算法在操作可见性和能源节约机会识别方面的实用性。
Feb, 2024