一种高效而直接的在线量化方法,通过删除产生更新来处理数据流
提出了自适应物联网数据分析框架,在优化的 LightGBM 和概念漂移适应的基础上实现异常检测。通过实验验证,该框架具有高准确性和效率,并且不需要人类干预即可进行连续学习和漂移自适应。
Apr, 2021
本文提出一种边缘 AI 系统中的概念漂移检测方法,通过序列计算实现神经网络的重新训练和检测概念漂移,降低计算和内存使用,实现在 Raspberry Pi Pico 等资源受限的设备上的应用。
Dec, 2022
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
该研究论文介绍了一种新的图数据流分类方法,能在节点和边随时间变化的情况下进行模型适应的增量学习,选择每个类别的代表图并创建嵌入表示,同时通过基于损失的概念漂移检测机制来重新计算图的代表图。
Apr, 2024
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
在线更新时间序列预测模型针对概念漂移通过基于流数据调整预测模型来解决挑战。我们提出了一种新颖的方法 D3A,首先检测概念漂移,然后在检测到漂移后积极调整当前模型以适应漂移的概念,从而快速适应。通过在现有的训练样例中引入高斯噪声的数据增强策略,我们提出了一种最大程度利用历史数据进行模型适应的方法。我们的实证研究跨越六个数据集,证明了 D3A 在提高模型适应能力方面的有效性。与简单的时间卷积网络(TCN)基准相比,D3A 将均方误差(MSE)平均降低了 43.9%。对于最先进的模型,MSE 降低了 33.3%。
Mar, 2024