大学辍学预测模型是否应包含受保护属性?
利用深度学习模型和 LSTM 层,研究了大规模收集的 121 种不同类别的特征对高等教育学生保留率的影响,早期对毕业和风险学生的区分能力良好,在后期对退学和转学的区分能力依赖于随时间累积的数据,提供个体层面的预测并解决转学结果问题,为教育结果预测提供了新的见解。
Sep, 2023
该研究对大规模行政数据在高等教育中对大学辍学预警系统中的贡献因素和预测性能进行了系统评估,发现大学第二年末的辍学预测在随机森林模型中的 AUC 比入学时高出 20%,而入学时的预测因素则被大学表现和后期的入学行为所取代,对于传统劣势背景学生来说,大学 GPA 对预测具有更高的价值。
Jan, 2024
大学辍学预测使用学术、人口统计、社会经济和宏观经济数据类型,通过训练四个二元分类器来预测学生是否会毕业或辍学,结果发现学术数据类型对模型性能最有影响。
Oct, 2023
本研究采用机器学习模型对一个高选择性的美国大学的本科入学申请数据进行实证评估,发现排除保护属性会严重降低预测入学决策的性能,而通过文本信息的加入能够部分恢复模型性能,但未能完全取代通过保护属性构建的多样性类。
Jun, 2023
本文研究如何建立预测模型以帮助识别处于风险中的学生并为他们提供更好的支持,但预测模型可能会存在性别和种族偏见,因此需要进行后续调整以提高公平性并平衡不同的公平措施。
Jun, 2020
本文提出了一种统计测试假设模型性能的过程,该过程超越了社区中的实践状态,分析了来自大规模在线开放课程(MOOC)的一系列算法和特征集。该方法揭示了论坛、作业和点击流基于特征提取方法之间的严重差距,其中后者明显优于前两者,而前两者相互之间无法区分,并为评估学生成功的预测或基于 AI 的模型以及设计和针对处于风险中的学生模型和干预措施的实践影响提供了方法论和实践上的启示。
Feb, 2018
本研究提出了一种针对监督学习中指定敏感属性的歧视判据,结合 FICO 信用评分案例研究来说明该判据是如何通过调整学习预测器的方式达到消除歧视的目的。同时,本文研究了基于被遗忘的测试方式定义和识别偏见的固有限制。
Oct, 2016
教育在减轻贫困、推动经济增长和赋予个人力量方面发挥着关键作用,然而,学校辍学的持续问题带来了重大挑战,本研究在 13 年的纵向数据集基础上通过机器学习模型的开发展现出显著的分类能力,未来这样的模型有可能支持教育工作者识别处于风险之中的学生,以改善教育结果。
Mar, 2024