AAAIMar, 2024

基于多准则比较的知识引导机器学习方法的推进

TL;DR描述了一种有应用广泛的模型评估方法,能够根据核心科学原理和更实用的结果评估人工智能 / 机器学习模型。该方法通过心理学和决策科学的预测竞赛产生,对各种类型和结构的候选模型进行了多个科学、理论和实际标准的综合评估,使用计算社会选择领域的投票规则进行标准分数的排序评估,可以对不同测量和模型类型进行整体评价。还讨论了其他优势和应用。