AAAIFeb, 2020

迭代数据编程扩展文本分类语料库

TL;DR该研究采用数据编程方法,使用基于邻域的弱模型来扩充文本数据集,并通过迭代的过程从大量未标记的数据中鉴别出稀疏分布的例子,并以人为中心确认这些标记数据的过程中,不断改进新的弱模型。研究结果表明,该方法可以显著提高文本分类任务的准确性。