SIGIRMay, 2019

信息检索中的统计显著性检验:对 I 型、II 型和 III 型误差的实证分析

TL;DR通过模拟 TREC 数据集,对不同的测试、系统、主题集大小和效益测量进行了分析,并评估了统计显着性测试在信息检索数据中的行为,为从业者提供了建议。五种测试涉及统计显着性测试、T - 检验、Bootstrap 检验、排列检验和 Wilcoxon 检验。