关键词imbalanced data classification
搜索结果 - 4
- $F_β$ 绘图 -- 用于评估不平衡数据分类器的可视化工具
针对不平衡数据分类问题,本文提出了一种分析广泛使用的参数化度量 $F_eta$ 的简单方法,以便根据用户需求确定何时选择特定模型。
- 处理磁盘数据不平衡的方法调查
分类问题中存在类别不平衡的情况,而数据又是为了提高准确性而设计的,类别不平衡可能导致几个类别的错分代价更高,本文综述了不平衡数据分类领域的研究,讨论了数据层方法、算法层方法和混合方法等三个主要方面,并总结分析了现有方法的问题、算法思想、优势 - 基于主成分随机外推的数据增广技术
本文提出了一种针对数据不平衡的数据增强方法 REPRINT,基于隐藏空间表示,运用主成分的子空间来生成新的目标类样本,同时采用标签重组技术实现新样本的标签合成,与多种 NLP 数据增强方法相比,在四个文本分类基准测试中显示出令人瞩目的改进。
- 关于数据集属性选择适当的重采样策略以解决类别不平衡问题
本文通过比较分析 40 个来自不同应用领域的数据集,研究了不平衡数据分类的各种因素对过采样和欠采样技术的有效性的影响,提出了基于性能度量的自动最优采样策略选择模型,可以在不同领域中选择最合适的方法。