Feb, 2024

基于子模块互信息的弱监督适用于冷启动主动学习

TL;DR利用 STENCIL 方法,在类不平衡冷启动环境下,通过选择一组弱标记的稀有类别实例并由注释者进行强标记来改善文本分类数据集的整体准确性和稀有类别的 F-1 分数,相对于常见的主动学习方法,STENCIL 方法提高了 10% 至 24% 的整体准确性和 17% 至 40% 的稀有类别 F-1 分数。