Jun, 2024

自监督编码器对未见数据集的聚类的实证研究

TL;DR用预训练模型在未被训练的数据集上进行推理,探讨其嵌入是否能够形成有意义的聚类,评估自监督模型的嵌入,发现不同于监督模型,自监督模型在训练领域内表现更好,在训练领域外则相反,而微调模型则展示了相反的趋势,聚类提供了一种评估自监督学习表示的方法,可用于无真实标签的数据的聚类性能,UMAP 降维空间中的轮廓系数与聚类性能高度相关,可以被用作对没有真实标签的数据的聚类性能的替代指标。