Dec, 2023

正样本未标记数据的单一样本对照抽样方法与病例对照抽样方法的比较:两种情景的故事

TL;DR本文研究了基于经验风险最小化(ERM)的分类器在针对阳性无标签数据的情况下可能在单样本场景下显著退化的问题,并引入了针对单样本情况的非负风险分类器,比较了其性能与原始提案的差异。研究发现,在标记了一半或更多阳性观察值的情况下,它们之间存在显著差异。同时,还考虑了将为案例对照数据设计的 ERM 最小化器应用于单样本数据的相反情况,并得出类似的结论。考虑不同情景的区别需要对经验风险的定义进行唯一但关键的改变。