Jun, 2024

无法处理(肮脏的)真相:以数据为中心的洞察提高了伪标注

TL;DR伪标记是一种使用少量标记样本来利用无标记数据的常用半监督学习技术。本研究提出了一种名为 DIPS 的数据特征化和选择框架,通过对学习动态的分析来改善伪标记方法,提高标记数据的质量,并展示了其在各种真实世界的表格和图像数据集上的应用和影响。综上所述,我们强调了在真实环境中数据为中心的伪标记方法的显著优势。