大学辍学预测模型是否应包含受保护属性？

Mar, 2021

大学辍学预测模型是否应包含受保护属性？

Should College Dropout Prediction Models Include Protected Attributes?

Renzhe Yu, Hansol Lee, René F. Kizilcec

TL;DR本文探讨了在大型美国研究型大学的简历中是否包含受保护属性是否会在预测学生退学方面造成歧视性，研究表明在预测表现和算法公平性方面，包含受保护属性不会影响总体表现，局部情况需要针对性评估和分析。

Abstract

Early identification of college dropouts can provide tremendous value for improving student success and institutional effectiveness, and predictive analytics are increasingly used for this purpose. However, ethical concerns have emerged about whether including →

college dropout predictive analytics protected attributes algorithmic fairness student success

发现论文，激发创造

学生成功建模：最重要的因素

利用深度学习模型和 LSTM 层，研究了大规模收集的 121 种不同类别的特征对高等教育学生保留率的影响，早期对毕业和风险学生的区分能力良好，在后期对退学和转学的区分能力依赖于随时间累积的数据，提供个体层面的预测并解决转学结果问题，为教育结果预测提供了新的见解。

Sep, 2023

大学辍学预测中的时间变异性和群组间变异性

该研究对大规模行政数据在高等教育中对大学辍学预警系统中的贡献因素和预测性能进行了系统评估，发现大学第二年末的辍学预测在随机森林模型中的 AUC 比入学时高出 20％，而入学时的预测因素则被大学表现和后期的入学行为所取代，对于传统劣势背景学生来说，大学 GPA 对预测具有更高的价值。

Jan, 2024

大学生退学原因预测及相关因素分析的机器学习技术应用

大学辍学预测使用学术、人口统计、社会经济和宏观经济数据类型，通过训练四个二元分类器来预测学生是否会毕业或辍学，结果发现学术数据类型对模型性能最有影响。

Oct, 2023

利用自然语言处理增强大学招生中的整体评估：基于论文和推荐信的分析

本研究采用机器学习模型对一个高选择性的美国大学的本科入学申请数据进行实证评估，发现排除保护属性会严重降低预测入学决策的性能，而通过文本信息的加入能够部分恢复模型性能，但未能完全取代通过保护属性构建的多样性类。

Jun, 2023

使用隐私人口统计数据进行公正学习

本文研究通过个人隐私保护的方式，实现对受保护属性的学习，在使用中不产生歧视，同时在受保护属性只在数据子集中存在的情况下，实现公平预测模型的学习。

Feb, 2020

评估预测学生成功的公平性权衡

本文研究如何建立预测模型以帮助识别处于风险中的学生并为他们提供更好的支持，但预测模型可能会存在性别和种族偏见，因此需要进行后续调整以提高公平性并平衡不同的公平措施。

Jun, 2020

MOOCs 中的 Dropout 模型评估

本文提出了一种统计测试假设模型性能的过程，该过程超越了社区中的实践状态，分析了来自大规模在线开放课程（MOOC）的一系列算法和特征集。该方法揭示了论坛、作业和点击流基于特征提取方法之间的严重差距，其中后者明显优于前两者，而前两者相互之间无法区分，并为评估学生成功的预测或基于 AI 的模型以及设计和针对处于风险中的学生模型和干预措施的实践影响提供了方法论和实践上的启示。

Feb, 2018

有监督学习中的机会平等

本研究提出了一种针对监督学习中指定敏感属性的歧视判据，结合 FICO 信用评分案例研究来说明该判据是如何通过调整学习预测器的方式达到消除歧视的目的。同时，本文研究了基于被遗忘的测试方式定义和识别偏见的固有限制。

Oct, 2016

测量和减轻具有多个受保护属性的表格数据中的偏差

提出了新的歧视衡量方法，并介绍了一种新的偏见减轻方法，实验证明了这种策略可以减少多个保护属性的数据集中的歧视。

May, 2024

机器学习早在小学毕业就能预测中学辍学

教育在减轻贫困、推动经济增长和赋予个人力量方面发挥着关键作用，然而，学校辍学的持续问题带来了重大挑战，本研究在 13 年的纵向数据集基础上通过机器学习模型的开发展现出显著的分类能力，未来这样的模型有可能支持教育工作者识别处于风险之中的学生，以改善教育结果。

Mar, 2024