集成模型在缺陷预测中的功效的可理解性分析
本文探讨了一种新的用于软件项目生产力预测的集成构建机制,利用带权平均方法来汇聚基模型的预测结果,结果表明基模型准确性不一致时,使用集成方法是一种良好的替代方案。
Dec, 2018
本研究使用神经网络和决策树作为分类算法,在 23 个数据集上评估了 Bagging 和 Boosting 两种集成方法。研究结果表明 Bagging 方法几乎总是比单个分类器更准确,而 Boosting 方法则在某些情况下比 Bagging 更不准确。数据集的特征对 Boosting 方法的表现有重要影响,这种方法可能会过拟合噪声数据集,从而减少性能。同时我们的结果也说明,集成模型的性能提升大部分发生在前几个分类器的组合中。
Jun, 2011
本研究使用机器学习技术对恶意软件检测进行了全面研究,重点评估了在 Mal-API-2019 数据集上使用各种分类模型的效果,旨在通过更有效地识别和减轻威胁来提升网络安全能力。研究探讨了集成和非集成的机器学习方法,例如随机森林、XGBoost、K 最近邻(KNN)和神经网络。特别强调了数据预处理技术的重要性,尤其是 TF-IDF 表示和主成分分析,在提高模型性能方面起到了积极作用。结果表明,集成方法,特别是随机森林和 XGBoost,相比其他方法表现出更高的准确性、精确度和召回率,凸显了它们在恶意软件检测中的有效性。该论文还讨论了限制和未来的潜在方向,强调了持续适应恶意软件演变性质的需求。这项研究为网络安全领域的持续讨论做出了贡献,并为在数字时代开发更强大的恶意软件检测系统提供了实用洞察。
Mar, 2024
通过减少模型数量或改进集成推断时的模型使用效率,本研究提出并评估了两种模型选择策略 —— 静态和动态,以在最小化能量使用的同时优化集成学习系统性能,平衡模型的准确性与能源消耗之间的挑战,结果显示静态策略将 F1 得分从基准线提高,并将平均能量使用从 100%降低到 62%,动态策略更进一步提升了 F1 得分,并使用平均 76%的能量,与完整集合相比为 100%,同时提出了一种资源消耗与准确性平衡的方法,大幅减少能量使用而不太影响准确性,静态策略的平均能量使用率从约 62%降低到 14%,动态策略从约 76%降低到 57%,实地研究结果表明在实际生产环境中采用注重能源的模型选择策略在 Green AI 方面具有实际应用性。
May, 2024
提出了一种基于贝叶斯优化 - 高斯过程(BO-GP)和集成树状学习模型的框架,以提高工业物联网环境中入侵和攻击检测的性能。实验结果显示,与标准树模型和集成树模型相比,该框架在检测精度、准确率和 F-score 方面有所提高。
Jan, 2024
本研究使用一组群体模型和机器学习模型来预测 COVID-19 疫情的近期趋势,结合病例、疫苗接种、人类流动和天气等数据,通过调整 Gompertz、Logistic、Richards 和 Bertalanffy 等经典人口模型和机器学习模型进行预测。该研究认为,对这两类模型进行集成能够提高预测的精度和鲁棒性,并可用于缺乏相关数据的情况下。
Jul, 2022
本文旨在开发一种两阶段的异常检测模型,通过集成机器学习技术 - 支持向量机和朴素贝叶斯,使用集成混合技术进行预测,以及神经网络分类器和随机森林算法进行结果分类,提高工业物联网网络的可靠性。测试结果表明,该模型的准确性最高可达 99%,且优于传统的技术。
Jan, 2021
本文在我们的基于集成的组件模型 DEECo 中扩展了使用机器学习和优化启发式算法来建立和重新配置自主组件集合的能力。我们展示了如何在模型层次上捕捉这些概念,并举例说明这样的模型如何有益地应用于工业 4.0 环境中与访问控制相关的问题。我们认为将机器学习和优化启发式算法纳入现代智能系统是一个关键特性,使其能够在学习过程中适应环境的不确定性并优化其行为。
Sep, 2023
天气模型的概率技能与延迟集合相比较,发现 GraphCast 和 Pangu 是领先的 AI 天气模型,在确定性评分方面前者优于后者,但在概率 CRPS 指标上两者得分相同。
Jan, 2024