高效流式学习

May, 2023

Stream Efficient Learning

Zhi-Hua Zhou

TL;DR本文介绍了基于数据流的机器学习的概念，提出了流式高效学习的概念，通过初步理论框架的介绍，探讨了在资源受限和时间要求的情况下，如何处理收到的数据以提高学习性能。

Abstract

Data in many real-world applications are often accumulated over time, like a stream. In contrast to conventional machine learning studies that focus on learning from a given training data set, learning from data streams

data streams machine learning generalization performance resource constraints stream efficient learning

发现论文，激发创造

数据流的历史背景

数据流机器学习是一个活跃且不断发展的研究领域，本文回顾了数据流研究的历史背景，并将其与机器学习在数据流中的常见假设联系起来。

Oct, 2023

数据流的自动机器学习技术

本文总结了现有开源的 AutoML 工具的最新进展，并将它们应用于数据流挖掘的领域。通过比较，结果表明现成的 AutoML 工具可以提供令人满意的结果，但在出现概念飘移时，必须应用检测或适应技术以维持预测准确性。

Jun, 2021

重新思考流式机器学习评估

探讨了流式机器学习问题的本质，阐述了延迟标签等实际挑战，建议采用新的性能度量标准来评估模型。

May, 2022

基于真实数据的流式学习算法基准测试挑战

本文提出了一个用于挑战流算法的公共数据存储库，其中包含来自文献的最受欢迎的数据集和与公共健康问题有关的新数据集，旨在缓解涉及流分类器和漂移检测器的实验性评估中的数据集选择问题，并对数据分布中不同类型变化及其导致的原因和问题进行了深入的讨论。

Apr, 2020

流式终身学习及任意时间推理

在动态环境中，在线、单通、类增的情况下，我们利用基于贝叶斯的框架和在线内存回访的有效方法来解决这个挑战性的 lifelong learning 问题，并在实验证明了我们的方法超越了此前的研究成果。

Jan, 2023

鲁棒的流式数据处理、采样及在线学习的视角

本文针对统计学习进行了概述，然后对鲁棒的流式技术和挑战进行了调查，并通过几个严格的结果证明了我们在整个过程中激发并暗示的关系。此外，我们将通常不相关的定理统一到一个共享的框架和符号中，以阐明我们所发现的深层次联系。我们希望通过从一个共享的视角探索这些结果，已经意识到存在的技术关联，能够启发两个领域的研究，并激发新的、以前未被考虑的研究方向。

Dec, 2023

持续原型演变：从非稳态数据流中在线学习

通过在共享的潜变量空间中不断更新原型解决了在线学习中原型过时和缓解遗忘的问题，提出了一种学习和预测任意时间点数据的系统。除了最近邻预测之外，通过提高类原型周围的聚类密度和增加类间方差来促进学习的同时，使用记忆库中的样本构成虚拟原型来提高潜在空间质量。

Sep, 2020

概念漂移下的增量式经验回放连续学习

提出了一种新的持续性学习方法来同时处理学习和存储新信息以及适应先前概念的变化，该方法引入了一个记忆库和一个反应子空间缓冲区来解决数据流挖掘和连续学习两个领域的问题。

Apr, 2021

量子流学习

研究了基于深度强化学习的流式数据学习，通过连续测量 qubit 以应对不同的噪声模式实现对量子系统进行即时控制，为提高量子技术打下基础。

Dec, 2021

流式主动学习：针对现实多分布环境的流式学习

本文提出了一种基于子模信息度量的新型流式活动学习框架 STREAMLINE，该框架通过识别切片、切片感知预算和数据选择的三步过程来补偿工作标记数据中情节驱动的切片不平衡，并在真实世界的流式场景中对图像分类和目标检测任务进行了广泛评估，发现相比基线方法 STREAMLINE 在数据的不频繁但关键的情节上的性能提高了 5％的分类准确度和 8％的 mAP。

May, 2023