多标签流分类中的效率与有效性平衡及缺失标签健壮性提供

Oct, 2023

多标签流分类中的效率与有效性平衡及缺失标签健壮性提供

Balancing Efficiency vs. Effectiveness and Providing Missing Label Robustness in Multi-Label Stream Classification

Sepehr Bakhshi, Fazli Can

TL;DR我们提出了基于神经网络的方法来处理高维度多标签分类问题，在数据流环境下通过选择性概念漂移适应机制，使用简单但有效的标签缺失填补策略，基于权重二元关联方法和广义集成学习系统来平衡效果与效率，并通过实验验证了该方法对于缺失标签和概念漂移的鲁棒性。

Abstract

Available works addressing multi-label classification in a data stream environment focus on proposing accurate models; however, these models often exhibit inefficiency and cannot balance effectiveness and efficiency. In this work, we propose a →

multi-label classification data stream environment neural network-based approach concept drift adaptation mechanism missing label imputation strategy

发现论文，激发创造

使用动态集成选择的不均衡数据流分类

提出了一种用于流数据分类的新框架，通过对非平稳漂移不平衡数据流进行数据预处理和动态集成选择技术的分类框架，以解决现代流数据分类面临的概念漂移和类不平衡数据的问题。实验结果表明，数据预处理结合动态集成选择技术在处理不平衡数据流时具有更高的准确性。

Sep, 2023

不均衡标签样本分布下的时尚检测数据高效训练

本文介绍了一种基于深度神经网络的加权目标函数方法，用于解决电子商务中多标签分类模型数据分布不平衡的问题，并以时尚属性检测为例进行了实验，结果表明相比于非加权和逆频率加权机制，采用新的加权机制的表现更好，同时验证了该方法在当今时尚业常见属性检测中的鲁棒性。

May, 2023

针对具有适度大标签空间的商业相关文本的不平衡多标签分类

比较了四种不同的方法在特定数据集上的多标签文本分类性能，结果表明，精细调整的 BERT 表现出较高的准确性，F1 得分，精确度和召回率，相比于其他三种方法表现更好。这些发现突出了 fine tuned BERT 在多标签文本分类任务中的有效性，并暗示它在分析复杂文本方面可能是一种有用的工具。

Jun, 2023

多标记学习缺失标记的简洁且健壮的损失设计

该论文提出两种简单且有效的基于强大损失设计的方法，通过减少假负例的影响及使用基于缺失标签的最大似然标准来改进多标签学习的性能，从而在大量多标签图像分类数据集上实现了新的最先进的损失函数。

Dec, 2021

通过建模弱标签集推进睡眠检测：一种新的弱监督学习方法

本研究提出了一种新颖的睡眠检测方法，使用弱监督学习来处理缺乏可靠标签的情况。通过借助常规睡眠检测算法生成的预测结果作为弱标签，引入了一种新的非线性统计模型。结合神经网络检测睡眠，以睡眠概率作为二项分布的参数，最大化该模型的似然函数等效于最小化软交叉熵损失。通过对多种模型和损失函数的比较，研究结果表明，基于软交叉熵训练的 LSTM 模型在精度和模型校准方面优于传统睡眠检测算法、其他神经网络架构和损失函数，并在患者数据集上验证了该建模框架的有效性。该研究不仅改进了缺乏真实数据的睡眠检测技术，还通过引入创新方法在弱监督学习领域做出了贡献。

Feb, 2024

探索集成方法提高文本分类器模型鲁棒性

本文通过分析一系列偏置特征并证明没有单一的模型适用于所有情况来改善模型的鲁棒性，进一步表明通过选择合适的偏置模型，我们可以获得比更复杂的模型设计基准更好的鲁棒性结果。

Oct, 2022

基于进化种群的极端验证延迟数据流分类

使用进化的、基于群体的方法来适应变化的效果的初步研究。维护每个类别的一个一类分类器集合，通过选择压力迫使集合适应数据流中的潜在变化。

Dec, 2023

大规模多标签文本分类 - 重新审视神经网络

本文研究了神经网络在多标签分类中的应用，并提出了一种使用深度学习算法的简单神经网络模型取代 BP-MLL 模型进行文本分类，证明了这些模型在六个不同属性的数据集上具有较好的性能表现。

Dec, 2013

不平衡数据流的在线集成学习

该论文提出了一个新的学习框架，结合了在线集成算法和成批的代价敏感采样 / 提升算法，有效地解决了同时处理代价敏感学习和在线学习的问题。

Oct, 2013

缺失标签的大规模多标签学习

本文研究多标记问题的通用经验风险最小化框架，提出了一种简单的框架，能高效地解决数据中存在缺失标记和标记量极大的问题。通过特定损失函数的结构，基于该框架设计了有效算法，进一步证明了该框架在存在缺失标记时的形式化过度风险边界。此外，对于低秩促进的迹 - 范数正则化，我们的风险界更紧，表现出更好的泛化性能。最后，在各种基准数据集上进行实验，证明了本方法的优越性以及其可扩展性。

Jul, 2013