COLINGOct, 2022

SelfMix: 自我混合训练抵御文本标签噪声的稳健学习

TL;DR本文提出一种用于处理文本分类任务中标签噪声的简单而有效的方法 SelfMix,该方法使用高斯混合模型来分离样本,并利用半监督学习。实验结果表明,我们的方法在不同类型的文本噪声下,比设计用于文本和视觉数据的强基线表现更优秀。