- ACLAnchorAL:用于大规模和不平衡数据集的高效主动学习
AnchorAL 是一种针对不平衡分类任务的主动学习方法,通过选择类特定的样本作为锚点,并从未标记数据池中获取最相似的样本来构建子池,从而解决了大型数据池上传统基于池的主动学习的计算复杂度高、准确率低的问题,并促进了对少数类实例的发现与类平 - ICLR选择性混合微调以优化不可分解的目标
通过互联网使用量的增加产生了大量的数据,从而导致了各种监督和半监督机器学习算法的采用,这些算法可以有效利用庞大的数据量来训练模型。然而,在将这些模型部署到实际环境之前,必须严格评估性能指标(如最坏情况召回率)并满足公平性等约束。我们发现目前 - 基于异质性的图神经网络用于不平衡分类
在这篇论文中,我们介绍了一种独特的方法,通过考虑图异质性来解决图中的不平衡分类问题。我们研究了类别不平衡和图异质性之间的错综复杂关系,发现少数类别不仅样本稀缺,而且表现出较低的同质性水平,这导致错误信息在相邻节点之间传播。基于这一洞察,我们 - 高效的混合过采样和智能欠采样用于不平衡大数据分类
引入了一种名为 SMOTENN 的新型重采样方法,它通过使用 MapReduce 框架将智能欠采样和过采样结合在一起,从而解决了不平衡分类问题。实验结果表明,该方法在小型和中型数据集上优于替代重采样技术,并在大型数据集上达到了良好的效果且运 - 基于标签感知的有界 CVaR 的鲁棒长尾学习
本文提出了两种基于 CVaR(条件风险值)的方法来改善长尾学习问题,在理论上提供了坚实的支持,通过实验证实了所提出方法的优越性。
- 不平衡分类的扩展大间隔损失
本文提出了一种新的针对非均衡分类的损失函数 LDAM loss,同时提出了一种扩大较大边界的 ELM loss,并通过对非均衡 CIFAR 数据集和长尾分布大规模数据集的实验验证,证明了相较于标准的 LDAM loss 和传统的非均衡分类损 - 使用初级保健免费文本荷兰医疗笔记进行软提示调整以预测肺癌
使用基于上下文的词表示法的自然语言处理方法,研究利用荷兰初级保健医生的患者医疗笔记进行早期肺癌预测的问题。使用大型 Transformer 预训练语言模型,调查软提示调整与传统模型微调,WEMs 与 PLMs 的比较,以及在少数患者的笔记上 - 重要性调节:过参数模型的群体鲁棒性
本文探讨了过度参数化模型的精度问题,提出了一种名为 “importance tempering” 的方法来解决分布偏移问题,并在实验中取得了最佳状态分类任务的最佳结果。
- CVPR动态环境下的长尾识别
通过 Open Long-Tailed Recognition++ 算法,实现在自然分布数据上的 imbalanced classification、few-shot learning、open-set recognition 和 acti - 基于进化算法辅助深度神经网络的非平衡图像分类分布学习
提出了一种在特征级别而非数据级别上基于过采样的解决不平衡分类任务中生成图像的质量多样性平衡问题的方法,并在这一基础上,设计了一种改进的估算分布算法,即基于潜在特征分布演化的改进估算分布算法 (MEDA_LUDE)。大量实验验证了所提出的算法 - 多类别不平衡训练的深度强化学习
针对日益复杂和不平衡的数据集,提出了一种基于强化学习的不平衡分类框架,并将其扩展为多类设置。在真实的临床案例研究中,实验表明该框架优于现有的不平衡学习方法,可以实现更公平和平衡的分类,同时也显着提高少数类别的预测准确性。
- 通过进化二层优化使用支持向量机处理不平衡分类问题
介绍了一种新的基于演化算法的、双层成本敏感的支持向量机方法 EBCS-SVM,可用于解决非平衡分类问题,并通过对 70 个数据集的实验结果进行比较,证明了其有效性。
- 基于课程学习的图神经网络用于不平衡节点分类
本文提出了一种基于课程学习的图神经网络框架(GNN-CL),包含两个模块:基于图的过采样和同时调整特征空间中少数类节点间距离的图分类损失和度量学习损失,通过动态调整这两个模块的权重实现更好的泛化和判别能力。该框架在多个广泛使用的图数据集上进 - CVPR从自然不平衡伪标签中进行无偏学习
本文提出一种基于对抗性反事实推理和自适应边界的偏差学习方法,旨在解决伪标签自然不平衡的分类问题。通过对大量实验数据的验证,实现了对 ImageNet-1K 进行半监督和零样本学习的显着精度提升。
- 使用平衡不确定性识别不正确的分类
本文提出了分布不平衡方法和 Balance True Class Probability 框架(BTCP),通过 Distributional Focal Loss (DFL) 目标函数学习不确定性估计来解决现有模型在不平衡分类数据上的预测 - ICCV探索长尾目标检测中的分类平衡
本研究提出使用平均分类得分来指示每个类别的分类准确性,并通过平衡损失和记忆增强特征采样方法,在长尾检测中找到分类平衡,显著提高了尾部类的检测性能,且代码可用。
- 动量加速随机 AUPRC 最大化的收敛
本文研究随机优化下精度 - 召回曲线(AUPRC)的最优化问题,通过开发随机动量方法和随机自适应方法,分别提升算法的收敛速度和迭代次数复杂度;通过实验验证效果。
- KDDImGAGN: 基于生成对抗图网络的不平衡网络嵌入
本文提出了一种名为 ImGAGN 的生成对抗图网络模型,通过引入一种名为 GraphGenerator 的新型生成器解决不平衡网络上的节点分类问题,该生成器可以模拟少数类节点的属性分布和网络拓扑结构分布,进而使不同类别节点的数量得以平衡,通 - EMNLPSetConv: 一种针对不平衡数据学习的新方法
本研究提出了一种名为 SetConv 的模型结构和训练策略,以解决在高不平衡度的情况下机器学习方法对多数类别过度倾向的问题,并在多个大规模基准文本数据集上进行了实验验证其优越性。
- AAAI稀有事件建模的变分分离
提出了一种基于极值分布和变分去解耦的方法,用于在高度不平衡的分类问题中学习罕见事件和提高临床决策支持系统的性能。该方法在合成研究和实际临床数据集上具有显著的性能优势,包括 COVID-19 毒性预测。