- 深度学习表示中的无监督概念漂移实时检测
提出了 DriftLens,一种基于深度学习表示的无监督实时概念漂移检测框架,能够比以前的方法更好地检测漂移,在至少 11 个测试用例中运行速度至少快 5 倍,并且其检测到的漂移值与实际漂移量非常相关(相关性≥0.85),对参数变化具有鲁棒 - 用于概念漂移的新型投注函数的 ICM 集成
这项研究通过引入改进的归纳式一致的鞅(Inductive Conformal Martingale, ICM)方法来解决概念漂移(Concept Drift)问题,并将 CAUTIOUS 投注函数与多个密度估计器相结合,以提高检测能力。同时 - 支持向量机的概念漂移可视化与滑动窗口
我们提出了一种基于平行坐标的新型可视化模型,通过连接连续时间窗口中分布的均值,将漂移显示为这些分布的变化,用于解释机器学习模型在选择漂移点时的决策,并能检测和描述概念漂移,为进一步研究开辟了可能性。
- 在概念漂移存在下的推进电机故障检测
运用机器学习和统计方法来增强海洋系统的监测和故障预测,本文介绍了一种能在概念漂移时成功运行且无需完全模型重新训练的检测驱动船舶推进电机定子绕组过热的方法。
- KDD使用整体私有模型集的概念漂移检测
深度神经网络(DNNs)是最广泛使用的机器学习算法之一。本文关注集成私有 DNNs 的概念来检测概念漂移,并引入一种名为 IPDD 的集成方法,不需要标签即可检测漂移。实验证明该方法在隐私性和效用上具有可比性。
- 时间序列的科尔莫戈洛夫 - 阿诺德网络:预测能力与可解释性之间的桥梁
Kolmogorov-Arnold Networks (KAN) 是 MIT 团队最近提出的一种划时代的模型,提供了一种具有改变游戏规则潜力的创新方法。本文探讨了 KAN 在时间序列预测中的应用,并提出了两个变体:T-KAN 和 MT-KA - 应对恶意软件概念漂移的主动性和解释性手段
DREAM 是一种新颖的系统,通过模型敏感性和数据自主性增强漂移检测,在半监督训练中主动捕捉恶意软件行为概念,并通过嵌入于检测器的潜在空间的恶意软件标签和概念解释扩大人工干预,以协调分类器和检测器的更新过程,从而能够有效提高漂移检测准确性并 - MM如何可持续监测机器学习系统?概念漂移检测中的准确性和能量效率平衡
通过对七种常用的概念漂移检测方法进行实验研究,我们的结果表明,根据能源效率和准确性的权衡考虑,概念漂移检测器可以分为三种类型:a) 以检测准确性为代价的能源效率检测器(KSWIN),b) 在能源消耗较低时具有较好准确性的平衡检测器(HDDM - 利用二维词嵌入进行困难数据流分类
提议了一种名为流式超表格机器学习(SSTML)的方法,通过使用 STML 算法将连续的数据块编码为图像表示,并执行单个 ResNet-18 训练周期,从而首次探索了多维编码(MDE)在困难数据流分类任务中的潜力,实验证明 SSTML 能够以 - 混合集成旅行方式预测
以城市和国家层面的各种出行方式数据集为例,我们提出了一种新颖的增量批处理和流处理模型的组合方法 (IEBSM),旨在适应出现在数据中的概念漂移,该方法结合漂移检测器、批处理学习和流式挖掘模型,与批处理和增量学习器进行比较,包括依赖主动漂移检 - 通过利用未来的恶意软件预测来对抗概念漂移
通过对比恶意软件检测分类器的两种未来样本预测方法(对抗训练和生成对抗网络),研究发现对抗训练方法虽能得到更稳健的分类器,但并不是恶意软件未来样本预测的好方法;与此不同的是,生成对抗网络能够成功用作未来恶意软件的预测方法,并显著提高分类器对新 - 自标注的多变量因果关系与自适应机器学习的量化
自适应机器学习应用于变化环境下的模型自适应,通过实现与因果相关的数据流自我标记方法,结合多变量因果关系和辅助模型的应用,提出了针对多变量因果图的自标记应用框架及评估方法。
- 基于液体神经网络的自适应学习与增量学习在由于网络故障引起的概念漂移中的链路负载预测比较
通过使用自适应学习算法(即液态神经网络),本研究针对交通预测问题解决了概念漂移问题,并且在实验结果中证明,在交通模式发生剧变时,我们提出的方法优于基于增量学习的方法。
- 在线机器学习的系统理论方法
机器学习在系统理论的视角下对在线学习的建模存在不完善之处,本文提出了一种基于系统设计的在线学习框架,包括在线学习的新定义和关键设计参数的识别,以及系统结构和系统行为的划分。同时,通过以医疗保健提供者欺诈检测为案例研究,将讨论与实际在线学习挑 - 基于概念漂移检测和基于原型的嵌入的图流分类的增量学习
该研究论文介绍了一种新的图数据流分类方法,能在节点和边随时间变化的情况下进行模型适应的增量学习,选择每个类别的代表图并创建嵌入表示,同时通过基于损失的概念漂移检测机制来重新计算图的代表图。
- 改进文本流中 Fine-tuning SentenceBERT 的采样方法
本研究旨在解决概念漂移的问题,探索了七种文本抽样方法对于语言模型进行精细调整并缓解性能退化的有效性。通过评估基于四种不同损失函数的 SBERT 模型的微观 F1 分数和耗时,研究发现 Softmax loss 和 Batch All Tri - 用可解释性概念漂移阻挠网络安全攻击
提出一种特征漂移解释(FDE)模块来识别漂移特征,该模块通过自动编码器(AE)重构回归深度学习模型的第一层激活,并找到它们的潜在表示。结果表明,FDE 成功识别了 85.77%的漂移特征,并展示了其在概念漂移现象下的 DL 适应方法中的实用 - 生成文本流中的漂移方法
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
- 引入自适应连续对抗训练(ACAT)以增强机器学习的鲁棒性
连续自适应对抗训练(ACAT)不断地将对抗训练样本整合到模型中,使用实际检测到的对抗数据,增强模型对不断演变的对抗威胁的抵抗能力,同时减轻灾难性遗忘,并降低了对抗样本检测所需的总时间。
- 迭代遗忘:使用受数据库启发的自适应粒度在线数据流回归
提出了一种基于数据库的数据流回归模型,通过从传入的数据流中创建粒子来保留相关信息,迭代地遗忘过时的粒子,并使用最近的数据和粒子提供低延迟预测。与现有算法相比,该方法丢弃数据能够显著提高延迟和训练时间的数量级,并且 R * 树灵感的粒化技术提