May, 2016

数据编程:快速创建大规模训练集

TL;DR为解决有限数据训练集的问题,本研究提出一种名为 Data Programming 的范式,通过弱监督策略和领域启发式标注函数生成训练集,以生成模型表示训练集的标注过程并降噪,探讨数据编程在监督学习中的应用及在 TAC-KBP 数据集上的检测等实验与研究。