data streams | BriefGPT - AI 论文速递

关键词data streams

搜索结果 - 39

AiGAS-dEVL：一种适应性增量神经气体模型用于极高验证延迟下的漂移数据流
AiGAS-dEVL 是一种基于神经气体增长的方法，用于处理数据流中概念漂移、验证延迟和自适应机制的情况。在合成数据集上的实验结果显示，AiGAS-dEVL 在适应性能上与其他基准方法相竞争，同时确保了一种简单且可解释的基于实例的自适应策略
PDF20 days ago
在线漂移检测与最大概念差异
在互联网时代，从海量数据流中进行持续学习变得非常关键。本论文提出了一种基于最大概念差异的新颖概念漂移检测方法 MCD-DD，通过对比学习概念嵌入，能够自适应地识别各种形式的概念漂移，而无需依赖标签或统计属性。通过在合成和实际场景下的大量实验
PDF20 days ago
StreamPrompt: 可学习的 Prompt 引导数据选择用于高效的流学习
StreamPrompt 使用动态的、可学习的提示方法增强数据选择，以解决流学习中的适应性和计算效率问题，并通过 Prompt Attunement 机制提高了提示的效率。在全面评估中，StreamPrompt 表现优越，并在准确性和训练时
PDF2 months ago
漂移检测：引入高斯分割检测器
该研究提出了一种新型批处理漂移检测器（GSD），能在没有真实类别标签的情况下监测数据流中的漂移变化，并且在实验中对比了其他算法，证明了该检测器在检测真实漂移和忽略虚假漂移方面的出色性能。
PDF2 months ago
利用二维词嵌入进行困难数据流分类
提议了一种名为流式超表格机器学习（SSTML）的方法，通过使用 STML 算法将连续的数据块编码为图像表示，并执行单个 ResNet-18 训练周期，从而首次探索了多维编码（MDE）在困难数据流分类任务中的潜力，实验证明 SSTML 能够以
PDF3 months ago
使用模糊任务边界和有噪标签的数据流抽样
在连续学习的领域中，数据流中存在的噪声标签是模型可靠性和公平性的显著障碍。我们提出了一种名为噪声测试去偏置（NTD）的新颖直观的采样方法，以减轻演变数据流中的噪声标签，并建立公平且稳健的连续学习算法。与之前的方法相比，NTD 在维持或超过准
PDF4 months ago
数据流的历史背景
数据流机器学习是一个活跃且不断发展的研究领域，本文回顾了数据流研究的历史背景，并将其与机器学习在数据流中的常见假设联系起来。
PDF9 months ago
流式多元时间序列的零延迟一致信号重建
通过学习多变量时序数据的时空依赖关系，利用递归神经网络以确保一致性，本研究提出了一种从数据流中一致重建量化间隔的方法。实验证明，相比非一致重建方法，我们的提议方法在采样率方面具有有利的误差率衰减效果。
PDFa year ago
流式场景下的距离函数和归一化
模型分类时数据归一化很重要，处理数据流的数据规范化尤其具有挑战性，本文比较了在数据流中应用 8 种距离函数的准确性，结果表明，在不进行规范化的情况下使用原始数据流和 Canberra 距离可获得良好的结果。
PDFa year ago
高效流式学习
本文介绍了基于数据流的机器学习的概念，提出了流式高效学习的概念，通过初步理论框架的介绍，探讨了在资源受限和时间要求的情况下，如何处理收到的数据以提高学习性能。
PDFa year ago
CVPRRenate：面向实际场景的持续学习库
本文介绍 Renata—— 一个用于 PyTorch 模型的实时更新管道的连续学习库，旨在解决实践中使用连续学习算法的需求，并展示了实验结果。
PDFa year ago
利用社交网络理论检测回归任务中的概念漂移进展
本文提出了一种基于社交网络理论的动态集合方法：Scale-free Network Regressor（SFNR），以检测数据流中的概念漂移。通过使用 Adaptive Window 算法，我们实现了更好的性能和准确性，尤其是在概念漂移的情
PDFa year ago
数据流的联邦学习
本文研究面向数据流的联邦学习方法，提出一种基于权重经验风险最小化的联邦学习算法，并在广泛的机器学习任务中对其性能进行了评估。
PDF2 years ago
评估 k-NN 在带概念漂移的数据流分类中的应用
研究比较不同算法对数据流分类的表现，提出 k-Nearest Neighbors 作为一种应对 concept drift 的可靠算法，并探讨了其时间复杂度和需要调整的参数 k 和 w。通过对比实验表明，k-NN 是一种值得采用的算法，能够
PDF2 years ago
多变量数据流的实时异常检测
本文提出了基于概率指数加权移动平均（PEWMA）的实时多元异常检测算法，能够在数据流中对 (突发瞬态、突发分布和渐变分布) 的数据漂移具有鲁棒性，且无需标记样本，能够有效检测概念漂移。
PDF2 years ago
一种用于快速极性标记大数据流的框架
本文提出了基于 Apache Flink 的 PLStream 框架，通过算法和系统优化处理数据流中的高速未标注数据，成功实现了高质量标注（准确率近 80%）且不需要人工干预的连续未标注数据流（约 16,000 元组 / 秒）。
PDF2 years ago
考虑多次出现的频繁串事件增量挖掘
本文提出一种新的序列模式挖掘问题，建议使用新的策略剪枝搜索空间，以识别模式的基本特征和之间的相互关系，并通过在真实和合成数据上的实验证明了该方法的有用性。
PDF3 years ago
第四届在线推荐系统和用户建模研讨会论文集 -- ORSUM 2021
探索在线服务的动态特性，通过增量算法在数据流中进行用户建模和个性化推荐。
PDF3 years ago
MM基于 I-DLV 的流推理系统 I-DLV-sr
基于逻辑的数据流推理系统，利用 Apache Flink 和 I^2-DLV 系统的框架实现了紧密微调的交互。
PDF3 years ago
IJCAI基于聚类的数据流分类框架
本文提出了一种基于聚类的数据流分类框架，通过采用基于密度的流聚类算法，结合动态阈值和有效的主动标签查询策略，处理非平稳数据流，解决了标注的初始集问题和重叠类别之间的分类挑战。同时对聚类中的子簇结构进行探索，有效的解决了类别之间的重叠问题。实
PDF3 years ago