- AiGAS-dEVL:一种适应性增量神经气体模型用于极高验证延迟下的漂移数据流
AiGAS-dEVL 是一种基于神经气体增长的方法,用于处理数据流中概念漂移、验证延迟和自适应机制的情况。在合成数据集上的实验结果显示,AiGAS-dEVL 在适应性能上与其他基准方法相竞争,同时确保了一种简单且可解释的基于实例的自适应策略 - 在线漂移检测与最大概念差异
在互联网时代,从海量数据流中进行持续学习变得非常关键。本论文提出了一种基于最大概念差异的新颖概念漂移检测方法 MCD-DD,通过对比学习概念嵌入,能够自适应地识别各种形式的概念漂移,而无需依赖标签或统计属性。通过在合成和实际场景下的大量实验 - StreamPrompt: 可学习的 Prompt 引导数据选择用于高效的流学习
StreamPrompt 使用动态的、可学习的提示方法增强数据选择,以解决流学习中的适应性和计算效率问题,并通过 Prompt Attunement 机制提高了提示的效率。在全面评估中,StreamPrompt 表现优越,并在准确性和训练时 - 漂移检测:引入高斯分割检测器
该研究提出了一种新型批处理漂移检测器(GSD),能在没有真实类别标签的情况下监测数据流中的漂移变化,并且在实验中对比了其他算法,证明了该检测器在检测真实漂移和忽略虚假漂移方面的出色性能。
- 利用二维词嵌入进行困难数据流分类
提议了一种名为流式超表格机器学习(SSTML)的方法,通过使用 STML 算法将连续的数据块编码为图像表示,并执行单个 ResNet-18 训练周期,从而首次探索了多维编码(MDE)在困难数据流分类任务中的潜力,实验证明 SSTML 能够以 - 使用模糊任务边界和有噪标签的数据流抽样
在连续学习的领域中,数据流中存在的噪声标签是模型可靠性和公平性的显著障碍。我们提出了一种名为噪声测试去偏置(NTD)的新颖直观的采样方法,以减轻演变数据流中的噪声标签,并建立公平且稳健的连续学习算法。与之前的方法相比,NTD 在维持或超过准 - 数据流的历史背景
数据流机器学习是一个活跃且不断发展的研究领域,本文回顾了数据流研究的历史背景,并将其与机器学习在数据流中的常见假设联系起来。
- 流式多元时间序列的零延迟一致信号重建
通过学习多变量时序数据的时空依赖关系,利用递归神经网络以确保一致性,本研究提出了一种从数据流中一致重建量化间隔的方法。实验证明,相比非一致重建方法,我们的提议方法在采样率方面具有有利的误差率衰减效果。
- 流式场景下的距离函数和归一化
模型分类时数据归一化很重要,处理数据流的数据规范化尤其具有挑战性,本文比较了在数据流中应用 8 种距离函数的准确性,结果表明,在不进行规范化的情况下使用原始数据流和 Canberra 距离可获得良好的结果。
- 高效流式学习
本文介绍了基于数据流的机器学习的概念,提出了流式高效学习的概念,通过初步理论框架的介绍,探讨了在资源受限和时间要求的情况下,如何处理收到的数据以提高学习性能。
- CVPRRenate:面向实际场景的持续学习库
本文介绍 Renata—— 一个用于 PyTorch 模型的实时更新管道的连续学习库,旨在解决实践中使用连续学习算法的需求,并展示了实验结果。
- 利用社交网络理论检测回归任务中的概念漂移进展
本文提出了一种基于社交网络理论的动态集合方法:Scale-free Network Regressor(SFNR),以检测数据流中的概念漂移。通过使用 Adaptive Window 算法,我们实现了更好的性能和准确性,尤其是在概念漂移的情 - 数据流的联邦学习
本文研究面向数据流的联邦学习方法,提出一种基于权重经验风险最小化的联邦学习算法,并在广泛的机器学习任务中对其性能进行了评估。
- 评估 k-NN 在带概念漂移的数据流分类中的应用
研究比较不同算法对数据流分类的表现,提出 k-Nearest Neighbors 作为一种应对 concept drift 的可靠算法,并探讨了其时间复杂度和需要调整的参数 k 和 w。通过对比实验表明,k-NN 是一种值得采用的算法,能够 - 多变量数据流的实时异常检测
本文提出了基于概率指数加权移动平均(PEWMA)的实时多元异常检测算法,能够在数据流中对 (突发瞬态、突发分布和渐变分布) 的数据漂移具有鲁棒性,且无需标记样本,能够有效检测概念漂移。
- 一种用于快速极性标记大数据流的框架
本文提出了基于 Apache Flink 的 PLStream 框架,通过算法和系统优化处理数据流中的高速未标注数据,成功实现了高质量标注(准确率近 80%)且不需要人工干预的连续未标注数据流(约 16,000 元组 / 秒)。
- 考虑多次出现的频繁串事件增量挖掘
本文提出一种新的序列模式挖掘问题,建议使用新的策略剪枝搜索空间,以识别模式的基本特征和之间的相互关系,并通过在真实和合成数据上的实验证明了该方法的有用性。
- 第四届在线推荐系统和用户建模研讨会论文集 -- ORSUM 2021
探索在线服务的动态特性,通过增量算法在数据流中进行用户建模和个性化推荐。
- MM基于 I-DLV 的流推理系统 I-DLV-sr
基于逻辑的数据流推理系统,利用 Apache Flink 和 I^2-DLV 系统的框架实现了紧密微调的交互。
- IJCAI基于聚类的数据流分类框架
本文提出了一种基于聚类的数据流分类框架,通过采用基于密度的流聚类算法,结合动态阈值和有效的主动标签查询策略,处理非平稳数据流,解决了标注的初始集问题和重叠类别之间的分类挑战。同时对聚类中的子簇结构进行探索,有效的解决了类别之间的重叠问题。实