论工业人工智能中概念漂移与不确定性的关系
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
本文提供了对无监督数据流中概念漂移的文献综述,主要关注概念漂移的检测和定位方法,并提供了对各种方法的系统性比较和在真实场景中的使用指南。另外,本文还探讨了解释概念漂移的新兴话题。
Oct, 2023
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
该研究通过比较基于错误率和数据分布的概念漂移检测器的性能,并评估它们在识别漂移时的可靠性,为实践者提供了指导建议和警报系统的适用性分析。
Nov, 2022
通过使用不确定性估计方法作为错误率的替代物来检测漂移,本研究对七个真实世界数据集进行了全面实证评估,旨在减少对标签较少且昂贵的部署后数据的依赖。结果表明,尽管 SWAG 方法表现出更好的校准性,但不确定性估计方法的选择对于检测漂移的整体准确性没有明显影响,甚至最基本的方法也表现出竞争性能,这些发现提供了不确定性基础漂移检测在真实世界安全关键应用中的实际适用性。
Nov, 2023
本文提出了一种概念漂移检测系统,利用联邦学习在每次迭代中提供的更新来缓解漂移对模型性能的影响,使用降维和聚类技术,实现了在智能交通系统中不同漂移阶段和系统暴露水平的各种非 iid 场景中检测漂移节点的框架。
Sep, 2021