关键词textual classification
搜索结果 - 2
- COLINGSelfMix: 自我混合训练抵御文本标签噪声的稳健学习
本文提出一种用于处理文本分类任务中标签噪声的简单而有效的方法 SelfMix,该方法使用高斯混合模型来分离样本,并利用半监督学习。实验结果表明,我们的方法在不同类型的文本噪声下,比设计用于文本和视觉数据的强基线表现更优秀。
- 文本分类数据增强调查
本文旨在提高机器学习分类系统的泛化能力,通过对数据进行转换的方式来人工创建训练数据,从而增强数据的多样性,该文章就在「文本分类」中,对数据增强方法及其应用目标做了详细概述与分类,最终针对相关领域,提出建设性思路方向。