Nov, 2023

智能制造中使用 CTGAN 的战略数据增强:提高纸浆和造纸生产中纸张断裂的机器学习预测能力

TL;DR在制浆造纸行业的预测性维护中,一项重要挑战是在生产过程中出现纸张断裂的频率相对较低。本文通过分析一台纸张制造机的运营数据,解决了纸张断裂事件稀缺但对经济影响较大的问题。利用包含 18,398 个样本的质量保证协议数据集,我们采用条件生成对抗网络(CTGAN)和合成少数类过采样技术(SMOTE)实现了一种新颖的数据增强框架。这种方法确保了合成数据与真实操作数据的分布一致性,同时也致力于提高预测建模的性能指标。通过评估三种不同的机器学习算法 - 决策树(DT)、随机森林(RF)和逻辑回归(LR),我们在 CTGAN 增强的数据集上取得了显著的预测维护性能改进。在数据稀缺性方面,CTGAN 的效果明显,对于决策树模型,机器断裂(类 1)的检测率提高了 30% 以上,对于随机森林模型提高了 20%,对于逻辑回归模型提高了近 90%。通过这种方法的进步,本研究对于工业质量控制和维护调度在制造过程中的罕见事件预测具有贡献。