信用评分中的分类方法:一项系统性综述和总体比较
本研究探讨了 12 种顶级的偏差缓解方法,讨论其性能,基于 5 种不同的公平度量标准、实现的准确性和金融机构的潜在利润。我们的研究结果表明,在保留准确性和利润的前提下实现公平存在困难,同时突出了一些最佳和最差的表现,并有助于实验机器学习和其工业应用之间的联系。
Sep, 2022
公司信用评级在当代经济和社会发展中起着非常重要的作用。这篇论文通过对国内外相关文献的阅读和研究,系统梳理了公司信用评级的发展背景,并从统计模型、机器学习模型和神经网络模型三个层面总结了常见的评级数据库,深入比较了不同模型的优缺点。最后,本文总结了当前研究存在的问题,并展望了公司信用评级的未来。相较于已有的公司信用评级综述,本文阐述和分析了神经网络模型在这个领域近年来的进展。
Sep, 2023
本文介绍了使用通话记录等大数据源以增强信用评分模型的性能及经济效益的研究。利用不同数据集结合社交网络分析技术,本文得出结论:在信用评分模型中融入通话记录等数据,可以显著提高其统计和经济性能,尤其是在利用利润度量和利润相关选择特征等方面。此外,调用行为特征不仅是其他模型中最具有预测性的特征,而且用它构建模型可以获得最佳利润。
Feb, 2020
应用分布鲁棒优化方法 (DRO) 研究信用评分,评估其在公平性、正确分类能力和解决边际比例变动时解决方案的稳健性方面的表现,结果显示 DRO 方法在公平性方面有显著改进,并且几乎不损失性能。但需要进一步完善有效实施这些系统。研究还指出,在信用评分环境中,许多常用的公平性指标并不适用,因为它们依赖于分类阈值的选择。
Feb, 2024
本文基于 Kaggle 中一家外国商业银行的客户信息数据集,使用 LightGBM 算法构建分类器对客户进行分类,以帮助银行判断客户信用违约的可能性。通过特征工程处理,如缺失值处理、编码、不平衡样本等,极大地提高了机器学习效果。本文的主要创新在于在原始数据集的基础上构建了新的特征属性,使分类器的准确率达到了 0.734,AUC 达到了 0.772,超过了许多基于相同数据集的分类器。该模型可以为商业银行的信用授予提供一些参考,同时也为其他类似研究提供了一些特征处理的思路。
Aug, 2023
本文提出了一种方法,通过对黑匣子分类器的决策函数进行抽样来学习可解释的替代模型,从而获得全局解释。该方法提供了一种统一解决方案,以简单的分类器逼近非线性决策边界,同时保持原来的分类准确性。我们使用私人住宅抵押违约数据集作为示例,说明了这种方法确保预处理期间属性的可分解性的可行性。
Nov, 2018
本研究利用机器学习模型对信用卡违约进行预测,通过一系列实验和数据处理技术,结果表明多层感知器神经网络(MLP)在预测信用卡违约和评估潜在风险方面表现优越,帮助银行等金融机构更早地预测贷款违约。
Oct, 2023
本研究探讨公平机器学习在征信评分中的应用,介绍了统计公平性准则、机器学习模型中公平性目标的算法选择,使用实际数据实证比较了不同的公平性处理器,发现多种公平性准则可以同时得到满足,提出分离度作为评估公平性的准则,证明了公平性处理器能在利润与公平性中找到一个良好的折中点,可以以较低的成本将算法歧视降低到合理的水平。
Mar, 2021
本文研究表明,相较于传统机构数据,利用基于应用程序的市场的替代数据对信用评分模型的影响。这些替代数据来源已经在传统银行和金融机构未能满足需求的人群中展现出巨大的预测借款人行为的能力。结果揭示,在两个国家得到了确认,这些新型数据来源特别适用于预测财务行为中低财富和年轻人,而这类人也是最有可能借助替代性贷款的人群。此外,通过使用 Stochastic Gradient Boosting 解释的 TreeSHAP 方法,我们的结果也显示,这些应用程序来源的变量存在着有趣的非线性趋势,这些趋势对于传统银行而言不是常见的信息。因此,这些研究结果展现了技术公司识别替代数据来源并妥善处理这些新信息的机会与挑战。同时,需要注意的是,替代数据必须经过认真的验证才能克服不同管辖区域的法规障碍。
May, 2020