Jun, 2023

基于 NLP 聚类和机器学习的信用风险模型问题分析:来自验证报告的洞见

TL;DR本文旨在探究如何使用聚类方法和机器学习算法,包括自然语言处理(NLP),通过验证报告中所包含的文本信息,来识别和分类信用风险模型中存在的问题。作者使用了嵌入式生成以及四个不同的预训练模型来分析 645 个所得发现的标题和观察结果,并使用各种聚类方法来将具有相似特征的发现进行分组,从而更有效地识别和分类每个验证维度和严重程度中存在的常见问题。在分析结果中,作者证明了聚类和机器学习可以有效地分析验证报告中的文本信息,并提供了信用风险模型开发和验证中遇到问题的洞见。