Feb, 2024

SimPro: 一个简单的基于概率的真实长尾半监督学习框架

TL;DR在这项研究中,我们提出了一个新颖的、高度适应的框架SimPro,它不依赖于对未标记数据分布的任何预定义假设。基于一种概率模型,我们创新地改进了期望最大化(EM)算法,通过明确分离条件和边际类别分布的建模来实现。这种分离在最大化阶段为类别分布估计提供了一个闭合形式的解,从而推导出贝叶斯分类器。而贝叶斯分类器则提高了期望阶段中伪标签的质量。值得注意的是,SimPro框架不仅具备理论保证,而且易于实现。我们还引入了两种新颖的类别分布,扩大了评估的范围。我们的方法在不同基准和数据分布场景下展示了一致的最先进性能。