基于进化种群的极端验证延迟数据流分类

Dec, 2023

基于进化种群的极端验证延迟数据流分类

An Evolving Population Approach to Data-Stream Classification with Extreme Verification Latency

Conor Fahy, Shengxiang Yang

TL;DR使用进化的、基于群体的方法来适应变化的效果的初步研究。维护每个类别的一个一类分类器集合，通过选择压力迫使集合适应数据流中的潜在变化。

Abstract

Recognising and reacting to change in non-stationary data-streams is a challenging task. The majority of research in this area assumes that the true class label of incoming points are available, either at each ti

change non-stationary data-streams classification accuracy evolving population-based approach one-class-classifiers

发现论文，激发创造

非平稳环境下基于数据流的具有验证延迟的主动学习

本文研究了有关时间变量和未知延迟验证对于主动学习问题的影响，提出了一种基于 PRopagate 和一个依据漂移情况的动态预算策略的解决方案。通过实验评估，发现该方法在不同的延迟时间和预算设置下优于现有技术。此外，还证明了在时间上变化预算分配可以提高主动学习策略的性能，而不增加总体标记预算。

Apr, 2022

持续原型演变：从非稳态数据流中在线学习

通过在共享的潜变量空间中不断更新原型解决了在线学习中原型过时和缓解遗忘的问题，提出了一种学习和预测任意时间点数据的系统。除了最近邻预测之外，通过提高类原型周围的聚类密度和增加类间方差来促进学习的同时，使用记忆库中的样本构成虚拟原型来提高潜在空间质量。

Sep, 2020

进化集成模糊分类器

本文提出了一种新的演化集成分类器，称为 Parsimonious Ensemble pENsemble，该方法由一种被称为 Parsimonious Classifier pClass 的演化分类器构建，具有动态的特征选择和集成结构，并具有检测漂移的新颖方案，在处理动态和演化数据流方面表现最有希望，可以在精度和复杂度之间实现平衡。

May, 2017

基于聚类的数据流分类框架

本文提出了一种基于聚类的数据流分类框架，通过采用基于密度的流聚类算法，结合动态阈值和有效的主动标签查询策略，处理非平稳数据流，解决了标注的初始集问题和重叠类别之间的分类挑战。同时对聚类中的子簇结构进行探索，有效的解决了类别之间的重叠问题。实验结果和定量比较研究表明，该方法提供了比现有方法更好或可比较的性能。

Jun, 2021

使用动态集成选择的不均衡数据流分类

提出了一种用于流数据分类的新框架，通过对非平稳漂移不平衡数据流进行数据预处理和动态集成选择技术的分类框架，以解决现代流数据分类面临的概念漂移和类不平衡数据的问题。实验结果表明，数据预处理结合动态集成选择技术在处理不平衡数据流时具有更高的准确性。

Sep, 2023

数据流的差分隐私集成分类器

该论文提出了一种基于隐私保护的集成学习方法，旨在应对连续数据流且涉及数据漂移的场景，该方法可以应对不断增长的数据流以及模型的升级更新，并适用于不同类型的预训练隐私分类 / 回归模型。在实际和模拟数据集上进行的实验表明，在不同的隐私、概念漂移和数据分布设置下，该方法表现优异。

Dec, 2021

特征可变流数据下的学习

本文提出了一种新的学习范式：可变特征流式学习，通过恢复消失的特征来提高性能，开发了两种集成方法与实验数据验证了我们的提议的有效性。

Jun, 2017

基于概念漂移检测和基于原型的嵌入的图流分类的增量学习

该研究论文介绍了一种新的图数据流分类方法，能在节点和边随时间变化的情况下进行模型适应的增量学习，选择每个类别的代表图并创建嵌入表示，同时通过基于损失的概念漂移检测机制来重新计算图的代表图。

Apr, 2024

非平稳环境下分类问题的自适应迁移学习视角

我们研究了一个具有非平稳标签转移的半监督分类问题，通过观察一组有标签的数据集和一系列无标签的协变量向量，我们的目标是预测每个协变量向量的相应类别标签，而无需观察除初始有标签数据集之外的真实标签。通过建立一个在任何给定测试时间内自适应地适应未知动态边缘标签概率的高概率遗憾上界，我们探索了一种基于统计方法的自适应迁移学习的替代方法，并给出了与在线学习方法相匹配的平均动态遗憾界限的界限。

May, 2024

演化多标记模糊分类器

本文提出了一种自适应、自进化的模糊多标记分类器，结合相关性算法、权重最小二乘法和 Lasso 正则化，实现递增式单遍分类，并提供在线主动学习策略和产品空间聚类，其中分类器更新所需的样本数减少了 90％，但几乎不会影响分类精度。

Mar, 2022