Jun, 2023

CELDA:利用黑盒语言模型作为增强分类器进行无标签分类

TL;DR该论文提出了一种名为CELDA的新方法,即聚类增强线性鉴别分析,通过从无标签数据集提取出精细的伪标签数据集并在其上训练轻量且稳健的模型来提高文本分类的准确性,从而达到新的状态,弥合了使用大型语言模型的差距,并具有普遍适用性和可扩展性。