Sep, 2021
学习强健的聚合标注函数进行半监督数据编程
Learning to Robustly Aggregate Labeling Functions for Semi-supervised
Data Programming
Ayush Maheshwari, Krishnateja Killamsetty, Ganesh Ramakrishnan, Rishabh Iyer, Marina Danilevsky...
TL;DR本研究提出了一种基于标签数据和未标签数据的半监督学习技术,利用标签数据产生可解释的标签函数(LFs),再通过数据编程获得大量嘈杂的标注数据,有效避免了需要大量标注数据的问题,并利用一个鲁棒的双层优化算法进行 LF 重加权,并在多个文本分类数据集上展示了效果显著的优势。