多标签流分类中的效率与有效性平衡及缺失标签健壮性提供
提出了一种用于流数据分类的新框架,通过对非平稳漂移不平衡数据流进行数据预处理和动态集成选择技术的分类框架,以解决现代流数据分类面临的概念漂移和类不平衡数据的问题。实验结果表明,数据预处理结合动态集成选择技术在处理不平衡数据流时具有更高的准确性。
Sep, 2023
本文介绍了一种基于深度神经网络的加权目标函数方法,用于解决电子商务中多标签分类模型数据分布不平衡的问题,并以时尚属性检测为例进行了实验,结果表明相比于非加权和逆频率加权机制,采用新的加权机制的表现更好,同时验证了该方法在当今时尚业常见属性检测中的鲁棒性。
May, 2023
比较了四种不同的方法在特定数据集上的多标签文本分类性能,结果表明,精细调整的 BERT 表现出较高的准确性,F1 得分,精确度和召回率,相比于其他三种方法表现更好。这些发现突出了 fine tuned BERT 在多标签文本分类任务中的有效性,并暗示它在分析复杂文本方面可能是一种有用的工具。
Jun, 2023
该论文提出两种简单且有效的基于强大损失设计的方法,通过减少假负例的影响及使用基于缺失标签的最大似然标准来改进多标签学习的性能,从而在大量多标签图像分类数据集上实现了新的最先进的损失函数。
Dec, 2021
本研究提出了一种新颖的睡眠检测方法,使用弱监督学习来处理缺乏可靠标签的情况。通过借助常规睡眠检测算法生成的预测结果作为弱标签,引入了一种新的非线性统计模型。结合神经网络检测睡眠,以睡眠概率作为二项分布的参数,最大化该模型的似然函数等效于最小化软交叉熵损失。通过对多种模型和损失函数的比较,研究结果表明,基于软交叉熵训练的 LSTM 模型在精度和模型校准方面优于传统睡眠检测算法、其他神经网络架构和损失函数,并在患者数据集上验证了该建模框架的有效性。该研究不仅改进了缺乏真实数据的睡眠检测技术,还通过引入创新方法在弱监督学习领域做出了贡献。
Feb, 2024
本文通过分析一系列偏置特征并证明没有单一的模型适用于所有情况来改善模型的鲁棒性,进一步表明通过选择合适的偏置模型,我们可以获得比更复杂的模型设计基准更好的鲁棒性结果。
Oct, 2022
本文研究了神经网络在多标签分类中的应用,并提出了一种使用深度学习算法的简单神经网络模型取代 BP-MLL 模型进行文本分类,证明了这些模型在六个不同属性的数据集上具有较好的性能表现。
Dec, 2013
本文研究多标记问题的通用经验风险最小化框架,提出了一种简单的框架,能高效地解决数据中存在缺失标记和标记量极大的问题。通过特定损失函数的结构,基于该框架设计了有效算法,进一步证明了该框架在存在缺失标记时的形式化过度风险边界。此外,对于低秩促进的迹 - 范数正则化,我们的风险界更紧,表现出更好的泛化性能。最后,在各种基准数据集上进行实验,证明了本方法的优越性以及其可扩展性。
Jul, 2013