May, 2024

重新审视互信息最大化在广义类别发现中的应用

TL;DR通过信息最大化(InfoMax)概率参数分类器的视角,本文重新探讨了泛化类别发现的挑战,发现通过确保已知和未知类的独立性,同时假设在所有类别上保持均匀的概率分布,可以扩大已知和未知类之间的边界,从而提高模型的性能。为了实现上述独立性,我们提出了一种基于新颖的 InfoMax 方法,即正则化参数 InfoMax(RPIM),该方法在 InfoMax 过程中使用伪标签监督未标记样本,并提出一种正则化方法来确保伪标签的质量。此外,我们引入了基于语义偏差转换的新颖特征优化方法,而不是直接微调来减少计算成本。大量实验在六个基准数据集上验证了我们方法的有效性。RPIM 在未知类方面显著提高了性能,超过了现有技术方法的 3.5%的平均边界。