Nov, 2017
Snorkel:利用弱监督实现快速训练数据创建
Snorkel: Rapid Training Data Creation with Weak Supervision
Alexander Ratner, Stephen H. Bach, Henry Ehrenberg, Jason Fries, Sen Wu...
TL;DRSnorkel 是一个无需手动标记数据的系统,它基于数据编程的机器学习范式实现了自动去噪,用户可以编写任意启发式函数以训练最先进的模型。在与美国退伍军人事务部和美国食品和药品管理局的两次合作以及代表其他部署的四个开源数据集上,Snorkel 相对于先前的启发式方法提高了 132%的平均预测性能,并且与大型手工筛选的训练集的平均预测性能相差不到 3.60%。