SIGIRMay, 2019
信息检索中的统计显著性检验:对 I 型、II 型和 III 型误差的实证分析
Statistical Significance Testing in Information Retrieval: An Empirical Analysis of Type I, Type II and Type III Errors
Julián Urbano, Harlley Lima, Alan Hanjalic
TL;DR通过模拟 TREC 数据集,对不同的测试、系统、主题集大小和效益测量进行了分析,并评估了统计显着性测试在信息检索数据中的行为,为从业者提供了建议。五种测试涉及统计显着性测试、T - 检验、Bootstrap 检验、排列检验和 Wilcoxon 检验。