高效流式学习
本文总结了现有开源的 AutoML 工具的最新进展,并将它们应用于数据流挖掘的领域。通过比较,结果表明现成的 AutoML 工具可以提供令人满意的结果,但在出现概念飘移时,必须应用检测或适应技术以维持预测准确性。
Jun, 2021
本文提出了一个用于挑战流算法的公共数据存储库,其中包含来自文献的最受欢迎的数据集和与公共健康问题有关的新数据集,旨在缓解涉及流分类器和漂移检测器的实验性评估中的数据集选择问题,并对数据分布中不同类型变化及其导致的原因和问题进行了深入的讨论。
Apr, 2020
在动态环境中,在线、单通、类增的情况下,我们利用基于贝叶斯的框架和在线内存回访的有效方法来解决这个挑战性的 lifelong learning 问题,并在实验证明了我们的方法超越了此前的研究成果。
Jan, 2023
本文针对统计学习进行了概述,然后对鲁棒的流式技术和挑战进行了调查,并通过几个严格的结果证明了我们在整个过程中激发并暗示的关系。此外,我们将通常不相关的定理统一到一个共享的框架和符号中,以阐明我们所发现的深层次联系。我们希望通过从一个共享的视角探索这些结果,已经意识到存在的技术关联,能够启发两个领域的研究,并激发新的、以前未被考虑的研究方向。
Dec, 2023
通过在共享的潜变量空间中不断更新原型解决了在线学习中原型过时和缓解遗忘的问题,提出了一种学习和预测任意时间点数据的系统。除了最近邻预测之外,通过提高类原型周围的聚类密度和增加类间方差来促进学习的同时,使用记忆库中的样本构成虚拟原型来提高潜在空间质量。
Sep, 2020
提出了一种新的持续性学习方法来同时处理学习和存储新信息以及适应先前概念的变化,该方法引入了一个记忆库和一个反应子空间缓冲区来解决数据流挖掘和连续学习两个领域的问题。
Apr, 2021
本文提出了一种基于子模信息度量的新型流式活动学习框架 STREAMLINE,该框架通过识别切片、切片感知预算和数据选择的三步过程来补偿工作标记数据中情节驱动的切片不平衡,并在真实世界的流式场景中对图像分类和目标检测任务进行了广泛评估,发现相比基线方法 STREAMLINE 在数据的不频繁但关键的情节上的性能提高了 5%的分类准确度和 8%的 mAP。
May, 2023