Aug, 2023

基于 LightGBM 和特征工程的高效商业银行客户信用风险评估

TL;DR本文基于 Kaggle 中一家外国商业银行的客户信息数据集,使用 LightGBM 算法构建分类器对客户进行分类,以帮助银行判断客户信用违约的可能性。通过特征工程处理,如缺失值处理、编码、不平衡样本等,极大地提高了机器学习效果。本文的主要创新在于在原始数据集的基础上构建了新的特征属性,使分类器的准确率达到了 0.734,AUC 达到了 0.772,超过了许多基于相同数据集的分类器。该模型可以为商业银行的信用授予提供一些参考,同时也为其他类似研究提供了一些特征处理的思路。