Sep, 2022

对有标签数据集中新类别发现的深入研究

TL;DR本文从有标记集合出发,关注如何更好地支持无标记数据集的新类别发掘,提出了一个基于语义相似度的标记集合选取方法,并定义了一个度量有标记集合与无标记集合之间语义相似度的数学方法,实验结果表明在低相似度环境下使用标记信息可能会导致次优结果。