一种高效而直接的在线量化方法，通过删除产生更新来处理数据流

Jun, 2023

一种高效而直接的在线量化方法，通过删除产生更新来处理数据流

An efficient and straightforward online quantization method for a data stream through remove-birth updating

Kazuhisa Fujita

TL;DR该研究提出了一种应对数据流概念漂移挑战的在线向量量化方法，并证明其在概念漂移下仍能生成最小化死单元，同时建议从该方法计算出的一些度量指标能帮助进行漂移检测。

Abstract

The growth of network-connected devices is creating an explosion of data, known as big data, and posing significant challenges to efficient data analysis. This data is generated continuously, creating a dynamic flow known as a →

big data data stream concept drift online vector quantization drift detection

发现论文，激发创造

针对物联网数据流的轻量级概念漂移检测和适应框架

提出了自适应物联网数据分析框架，在优化的 LightGBM 和概念漂移适应的基础上实现异常检测。通过实验验证，该框架具有高准确性和效率，并且不需要人类干预即可进行连续学习和漂移自适应。

Apr, 2021

通过模型重用处理概念漂移

研究了如何通过模型重用应对数据流中的概念漂移问题，为每个模型赋予权重，并根据模型性能自适应调整权重，在合成和真实数据集上进行实验验证方法的优越性。

Sep, 2018

Quilt：面对概念漂移的鲁棒数据段选择

通过使用 Quilt，这是一个数据中心的框架来鉴定和选择能够最大化模型准确性的数据片段，从而提高模型准确性和效率。

Dec, 2023

描述概念漂移

本研究提出了一个全面的概念漂移类型的分类法并支持定量分析，从而为解决这一问题提供了基础。

Nov, 2015

面向低端边缘设备的设备学习顺序概念漂移检测方法

本文提出一种边缘 AI 系统中的概念漂移检测方法，通过序列计算实现神经网络的重新训练和检测概念漂移，降低计算和内存使用，实现在 Raspberry Pi Pico 等资源受限的设备上的应用。

Dec, 2022

生成文本流中的漂移方法

本文提供了四种文本漂移生成方法，以便生成带有标记漂移的数据集，并使用增量分类器测试它们恢复漂移的能力。结果表明，所有方法在漂移后性能都有所下降，增量支持向量机在准确性和宏 F1 得分方面运行速度最快，恢复了之前的性能水平。

Mar, 2024

基于概念漂移检测和基于原型的嵌入的图流分类的增量学习

该研究论文介绍了一种新的图数据流分类方法，能在节点和边随时间变化的情况下进行模型适应的增量学习，选择每个类别的代表图并创建嵌入表示，同时通过基于损失的概念漂移检测机制来重新计算图的代表图。

Apr, 2024

关于相关数据概念漂移的一点注记

概念漂移对机器学习模型产生不准确的影响，并且在流式数据背景下，多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响，因此需要对现有定义进行重大修改，特别是平稳性的概念不适用于这种设置，而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。

Dec, 2023

数据流聚类：一篇综述

该文综述了数据流聚类算法的基本概念和特点，对不同算法进行了对比分析，讨论了数据流聚类存在的问题和挑战。

Jul, 2020

解决在线时间序列预测中的概念漂移问题：检测然后适应

在线更新时间序列预测模型针对概念漂移通过基于流数据调整预测模型来解决挑战。我们提出了一种新颖的方法 D3A，首先检测概念漂移，然后在检测到漂移后积极调整当前模型以适应漂移的概念，从而快速适应。通过在现有的训练样例中引入高斯噪声的数据增强策略，我们提出了一种最大程度利用历史数据进行模型适应的方法。我们的实证研究跨越六个数据集，证明了 D3A 在提高模型适应能力方面的有效性。与简单的时间卷积网络（TCN）基准相比，D3A 将均方误差（MSE）平均降低了 43.9%。对于最先进的模型，MSE 降低了 33.3%。

Mar, 2024