利用社交网络理论检测回归任务中的概念漂移进展
该研究论文介绍了一种新的图数据流分类方法,能在节点和边随时间变化的情况下进行模型适应的增量学习,选择每个类别的代表图并创建嵌入表示,同时通过基于损失的概念漂移检测机制来重新计算图的代表图。
Apr, 2024
在实时标签获取困难的场景中,本文提出了一种适用于有限标记数据的流式环境的最优策略,引入了一种自适应的无监督回归技术。该方法利用一组稀疏的初始标签,并引入创新的漂移检测机制,以响应数据中不断变化的模式实现动态模型调整。通过将 ADWIN 算法与基于 RMSE 的误差广义化相结合,我们提高了适应性。ADWIN 实现了实时漂移检测,而 RMSE 提供了对模型预测准确性的稳健度量。该组合使得我们的多变量方法能够有效地应对流式数据的挑战,在保持高水平的预测准确性的同时不断适应变化的模式。最后,我们对各种公共数据集评估了我们的多变量方法的性能,并将其与非适应性基线进行比较。通过综合评估,我们证明了我们的自适应回归技术在实时标签获取具有挑战性的任务中的出色效果。结果突显了该方法超越传统方法的能力,并凸显了在标签稀缺和数据模式不断变化的情境中的潜力。
Dec, 2023
深度神经网络(DNNs)是最广泛使用的机器学习算法之一。本文关注集成私有 DNNs 的概念来检测概念漂移,并引入一种名为 IPDD 的集成方法,不需要标签即可检测漂移。实验证明该方法在隐私性和效用上具有可比性。
Jun, 2024
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
本文提出了一种概念漂移检测系统,利用联邦学习在每次迭代中提供的更新来缓解漂移对模型性能的影响,使用降维和聚类技术,实现了在智能交通系统中不同漂移阶段和系统暴露水平的各种非 iid 场景中检测漂移节点的框架。
Sep, 2021
研究了在流数据场景下,概念漂移对先前学习的模型造成的影响和需要重新训练的需求,提出了一种基于漂移检测和更广泛的稳态 / 响应态过程的自适应学习算法,并在实验中验证了该算法优于先前基于漂移检测的方法,并可以应用于多种监督学习问题。
Mar, 2020
这篇论文对文本流场景中的概念漂移适应进行了系统的文献综述,包括文本漂移类别、文本漂移检测类型、模型更新机制、流式挖掘任务、文本表示类型以及文本表示更新机制,并讨论了漂移可视化和模拟,列举了所选论文中使用的真实世界数据集。
Dec, 2023
基于 Neighbor-Searching Discrepancy 的新统计量,提出了一种能够高准确率检测真实概念漂移并忽略虚假漂移的方法,同时还能指示分类边界变化的方法。实验结果表明,该方法在不同分布和维度下具有鲁棒性,并且在漂移检测方面优于现有方法。
May, 2024
研究比较不同算法对数据流分类的表现,提出 k-Nearest Neighbors 作为一种应对 concept drift 的可靠算法,并探讨了其时间复杂度和需要调整的参数 k 和 w。通过对比实验表明,k-NN 是一种值得采用的算法,能够在不太苛刻的时间约束下实现对数据流的分类。
Oct, 2022
该论文提出了一种名为线性四速率(LFR)的框架,用于检测概念漂移并识别属于新概念的数据点(用于重新学习模型)。与传统的概念漂移检测方法不同,LFR 可适用于批处理和流数据;不受响应变量分布属性(例如,具有不平衡标签的数据集)的限制;独立于基础统计模型;并使用直观可理解的用户指定参数。该文的实验结果表明,LFR 在各个概念漂移类型的数据集中,在概念漂移检测的精确性、准确性和延迟方面都显著优于基准方法。
Apr, 2015