Mar, 2024
自然语言处理竞赛中系统性能分析
Analysis of Systems' Performance in Natural Language Processing Competitions
Sergio Nava-Muñoz, Mario Graff, Hugo Jair Escalante
TL;DR合作竞争的科学和技术领域变得越来越受欢迎。本文描述了一种评估方法来对比竞赛结果和竞争。这种方法具有普适性,但是以八个自然语言竞赛为案例进行了说明,涉及分类和回归问题。所提出的方法具有多种优势,包括与修正机制的即插即用比较和置信区间的包含。此外,我们引入了一些指标,使组织者能够评估竞赛的难度。我们的分析显示了我们方法在有效评估竞赛结果方面的潜在有用性。