Aug, 2023

AI 竞赛 - 使用统计复采样稳健地排名求解器

TL;DR通过统计重采样技术,本研究调查了竞赛结果的普遍适用性问题,并提出了一种基于重采样性能数据的统计稳健解算器排名方法。应用于最近的 SAT、AI 规划和计算机视觉竞赛,分析结果显示了解算器性能的频繁统计并列以及与基于简单评分的官方结果相比的排名倒置。