Nov, 2014

评估人群的可靠性

TL;DR本文介绍了一种用于生成工人错误率估计的置信区间的技术,以更好地评估工人质量。实验结果表明该技术在真实数据集中能生成正确的置信区间,并可用于清退表现不佳的工人,并为答案的准确性提供置信区间。