NIPSDec, 2017

FlagIt: 一个最小监督的人贩指标挖掘系统

TL;DR本文探讨了在线性广告领域中的指标挖掘问题,介绍并研究了 FlagIt 系统,该系统结合轻量级专家系统和经典的半监督(启发式重新标记)及最近发布的最先进的无监督文本嵌入,能够为数百万个句子打上高度与人口贩卖相关的指标。 FlagIt 技术堆栈是开源的。FlagIt 在涉及五个指标的初步评估中,与几种替代方案相比,表现出有希望的性能。FlagIt 系统正在积极开发、完善,并被整合到一个面向领域的搜索系统中,该领域专门用于打击人口贩卖,并正在被积极扩展以使用最少的编程工作来开采至少六个以上的指标。FlagIt 是一个在有限的标签设置中运行,并需要创造性地结合现有机器学习技术来产生可供非技术分 析师使用的输出的系统的良好示例。