- 不平衡数据、表示学习和 SEP 预测的调查
深度学习方法在回归、分类和预测等各种数据驱动任务中取得了显著进展,但其进步往往建立在对训练数据集相对平衡的不切实际的假设上。然而,与现实世界中数据经常不平衡的情况不符,这削弱了这些模型在实际应用中的效果。本调查报告介绍了一些深度学习研究,摒 - 使用向量量化生成对抗网络在磁共振成像中生成 3D 脑肿瘤区域
提出了一种使用矢量量化生成对抗网络和转换器的方法来生成高分辨率、多样化的三维脑肿瘤感兴趣区域(ROI),作为用于诊断罕见脑肿瘤的 MRI 扫描的辅助数据,实验证明该方法在平衡数据和提高分类性能方面的有效性。
- 无约束特征模型下的神经塌陷问题
本研究通过在不受约束的特征模型背景下,研究了交叉熵损失函数下不平衡数据的神经崩溃现象,发现特征向量在同一类中收敛为相同的平均向量,并确定了少数类崩溃的临界阈值,并且结果表明,数据大小不平衡的影响随着样本大小的增长而减小。实验结果验证了理论分 - 从 SMOTE 到 Mixup 的深度不平衡分类
通过增强传统的 SMOTE 方法并与 Mixup 结合,提出了一种统一的深度学习数据增强框架,实验结果表明该方法在深度不平衡分类任务上具有最先进的性能,并且在极度不平衡数据上也达到了优异的效果。
- 在通用树网络上处理不平衡数据的分布式双坐标上升算法
研究了不平衡数据对树网络中分布式双坐标上升法在解决分布式机器学习中的经验损失最小化问题时的收敛性的影响,提出了一种考虑不平衡数据信息的延迟广义分布式双坐标上升方法,并给出了该算法的分析。数值实验证明了我们提出的方法在提高树网络中分布式双坐标 - ICCV理解分类如何有助于回归的方法
在计算机视觉的深度回归方法中,添加一个分类损失到回归损失中可以得到改进的结果,尤其对于存在不平衡数据的回归任务尤为明显,因此我们建议在不平衡数据的回归任务中添加一个分类损失。
- 损伤视觉开采不平衡异常检测机会
在这项研究中,我们概述了在视觉检测、异常检测、损坏数据挖掘和预测性维修方面的不平衡数据问题,并提供了在木材、混凝土损坏和灾难损害等视觉数据集上的清晰示例,证明了正例比率范围越大,异常检测应用的准确性提高越高的假设结果。
- ECL:长尾皮肤病变分类的类增强对比学习
通过类增强对比学习方法,使用平衡的代理模型和参数优化策略,配合平衡的加权交叉熵损失函数,对于不平衡肌肤病变数据的分类问题进行了实验,证明了该方法的卓越性和有效性。
- 平衡方法对于不平衡分类问题中模型行为的影响
本研究采用可解释的人工智能工具,探讨样本平衡方法对模型行为的影响,旨在选出一种最佳的数据平衡策略以提高机器学习模型的可靠性。研究结果表明,平衡方法的使用会显著改变模型行为,呈现出对平衡分布的偏见。
- 手术阶段和器械识别:如何确定适当的数据集划分
本文介绍了一款开放式在线应用程序,可以可视化数据分区的评估,特别是在识别亚优化数据集分区方面,在高度不平衡的类分布中获取有意义的结果需要特别注意适当分割的选择。
- DiffMix:基于扩散模型的数据合成对于不平衡病理图像数据中的细胞核分割和分类的应用
本文提出了一种使用扩散模型的现实数据合成方法,以平衡核类别和扩大观察各种核的机会,并使用语义标签条件扩散模型来生成逼真且高质量的图像样本,证明该方法提高了罕见类型的核分类的分类性能,同时在不平衡病理核数据集中显示出卓越的分割和分类性能。
- 评估 GAN 生成的合成表格数据在类别平衡和低资源环境下的实用性
本研究旨在解决分类任务中不平衡数据的问题,并评估 SMOTE、ADASYN 和 GAN 技术在生成合成数据以解决类别不平衡和提高分类模型在低资源环境下的性能方面的适用性。
- AnoOnly: 无需正常数据损失的半监督异常检测
AnoOnly, a semi-supervised anomaly detection framework using weak supervision with batch normalization, addresses the is - ICML基于威布尔–柯西分布的角 Softmax 模型用于长尾视觉识别
提出了一种新的 softmax 函数 (Wraped Cauchy Distributed Angular Softmax),可以解决视觉识别中不平衡数据和长尾数据的问题。该方法使用基于高斯核的数据智能,并且可以对类别的角度表示进行分布,可 - 不平衡深度回归问题的不确定性投票专家混合模型
该研究提出了一种适用于回归问题的新型混合专家方法,利用个体专家的预测不确定性作为融合的依据,实现对不平衡数据的有效学习。实验结果表明,该方法优于现有备选方案,同时产生更好的不确定性估计。
- 使用自适应最优输运生成可靠伪标签的稳健短文本聚类表示学习
本文提出了一种鲁棒的短文本聚类模型 (RSTC),通过假标签生成模块和鲁棒的表示学习模块,提高抗噪声和不平衡数据的鲁棒性,实验证明在 8 个短文本聚类数据集上优于现有模型。
- 表格学习的自强化注意力机制
本研究介绍了一种名为 SRA 的注意力机制,通过使用权重向量来学习可解释的表示,并在基准模型的端到端组合中有效应用于合成和现实世界的不平衡数据。
- 面向长尾目标检测的实例感知重复因子采样
提出了一种简单但有效的方法 —— 实例感知重复因素采样(IRFS),该方法可以通过将实例计数和图像计数统一来增强长尾数据集中罕见类别目标检测模型的泛化性能,并在多种架构和骨干网络上展示出显著的改进效果,是一种强大的基准模型。
- 联邦组合深度 AUC 最大化
本研究提出了一种针对非平衡数据的联邦学习方法,通过直接优化曲线下面积(AUC)分数,采用分解最小最大优化问题和随机梯度下降优化算法,以及提供算法的计算和通信复杂性界限,达到了有效性的实验结果。
- 探究数据增强在不平衡数据中的作用
本研究通过实验检验了数据增强对神经网络、支持向量机和逻辑回归模型的影响,发现它可以帮助模型更好地泛化,在处理不平衡数据分类问题时效果显著。其中一个机理是通过促进数据的差异性,使得机器学习模型能够将数据的变化与标签关联起来,从而提高了模型的泛