NIPSNov, 2018

基于选择标签的噪声准确、数据高效的固有风险评分学习

TL;DR本文探讨了一种新的数据标记和数据收集模式,解决了评估高风险和低风险的两大难点。利用这种选择式的数据标记模式,以及最优实验设计方法构建了共 188 个样例和 24 个特征的模型。结果表明,在测试集上取得了 89% 的准确率和 93% 的 ROC 曲线下面积,对于银行反洗钱等工作有较强的实际应用价值。