Nov, 2022

语言模型分类器在再入院预测中比 XGBoost 更符合医生词汇敏感性

TL;DR本文介绍了一种新的评估模型性能的方法 —— 敏感分数,并通过比较专业医生和机器学习模型敏感分数在词汇级别上的排名相关性来评估其决策逻辑差异。结果表明,敏感分数可以更准确地衡量模型的鲁棒性,该方法可以用于自然语言处理等领域的分类任务的性能评估。