May, 2023

使用自适应最优输运生成可靠伪标签的稳健短文本聚类表示学习

TL;DR本文提出了一种鲁棒的短文本聚类模型 (RSTC),通过假标签生成模块和鲁棒的表示学习模块,提高抗噪声和不平衡数据的鲁棒性,实验证明在 8 个短文本聚类数据集上优于现有模型。