KDDJan, 2022

非平衡分类场景下的冷启动主动学习策略

TL;DR该研究提出了一种新的主动学习策略,专门解决大量无标签数据的分类初始化问题,同时处理不平衡的上下文,通过使用元素分数结合从聚类结构提取的信息到标签传播模型来解决标签稀缺和不平衡问题。以 Twitter 内容注释为例,该方法有效地处理了类别不平衡问题,提高了少数类样本的召回率。