May, 2023
使用自适应最优输运生成可靠伪标签的稳健短文本聚类表示学习
Robust Representation Learning with Reliable Pseudo-labels Generation via Self-Adaptive Optimal Transport for Short Text Clustering
Xiaolin Zheng, Mengling Hu, Weiming Liu, Chaochao Chen, Xinting Liao
TL;DR本文提出了一种鲁棒的短文本聚类模型 (RSTC),通过假标签生成模块和鲁棒的表示学习模块,提高抗噪声和不平衡数据的鲁棒性,实验证明在 8 个短文本聚类数据集上优于现有模型。