利用地理位置信息预测银行卡使用情况
本研究利用机器学习模型对信用卡违约进行预测,通过一系列实验和数据处理技术,结果表明多层感知器神经网络(MLP)在预测信用卡违约和评估潜在风险方面表现优越,帮助银行等金融机构更早地预测贷款违约。
Oct, 2023
使用神经网络、自然语言处理以及高斯混合模型,对推特文本中的地理位置进行预测,在全球范围以及美国范围内实验结果的中位误差分别小于 30 公里和 15 公里。
Mar, 2023
本文基于 Kaggle 中一家外国商业银行的客户信息数据集,使用 LightGBM 算法构建分类器对客户进行分类,以帮助银行判断客户信用违约的可能性。通过特征工程处理,如缺失值处理、编码、不平衡样本等,极大地提高了机器学习效果。本文的主要创新在于在原始数据集的基础上构建了新的特征属性,使分类器的准确率达到了 0.734,AUC 达到了 0.772,超过了许多基于相同数据集的分类器。该模型可以为商业银行的信用授予提供一些参考,同时也为其他类似研究提供了一些特征处理的思路。
Aug, 2023
该研究使用机器学习模型,对埃塞俄比亚一家私人银行提供的数据进行分析,发现 XGBoost 模型在 KMeans SMOTE 过采样数据上取得了最高的 F1 分数,而评估信贷风险时,申请人的年龄、就业年限和总收入等因素比抵押相关的因素更为重要。
Aug, 2022
本文介绍了我们基于神经网络使用自动化方法的解决方案,获得了 381 个团队中 ECML/PKDD 发现挑战赛优胜。我们预测了出租车行驶的目的地,输入是由 GPS 点、出发时间、司机 ID 和客户信息组成的变长序列。我们的方法可以方便地应用于其他预测固定长度输出的变长度序列问题中。
Jul, 2015
心血管疾病与吸烟、血压升高和胆固醇水平的关联突出了这些危险因素的重要性。本研究使用六种不同的机器学习模型进行比较分析:Logistic 回归、支持向量机、决策树、包装法、XGBoost 和 LightGBM。结果表明,XGBoost 作为表现最佳的模型,显示了提高冠状动脉梗塞预测精确性的潜力。
Nov, 2023
本文旨在探究如何使用聚类方法和机器学习算法,包括自然语言处理(NLP),通过验证报告中所包含的文本信息,来识别和分类信用风险模型中存在的问题。作者使用了嵌入式生成以及四个不同的预训练模型来分析 645 个所得发现的标题和观察结果,并使用各种聚类方法来将具有相似特征的发现进行分组,从而更有效地识别和分类每个验证维度和严重程度中存在的常见问题。在分析结果中,作者证明了聚类和机器学习可以有效地分析验证报告中的文本信息,并提供了信用风险模型开发和验证中遇到问题的洞见。
Jun, 2023
该研究使用弱监督、自然语言处理和深度神经网络技术对银行交易进行分类,建立了一个高效可扩展的数据处理管道,展示出比现有市场领先解决方案更有效的分类性能,并能快速扩展到新的使用案例,从而提高了金融健康报告和信用风险评估等金融应用的可用性。
May, 2023
通过结合自然语言处理技术与机器学习算法,我们描述了一个将银行交易描述分类为个人财务管理的新系统,在一个实际客户交易数据集上进行了训练和测试,并在与其他方法的比较中表现出较高的准确性,同时考虑了复杂性和计算时间。
Mar, 2024
本文探究了基于地理和用户移动性的机器学习特征在商业成功中的预测能力, 并通过采集自 Foursquare 的数据集在纽约城市中研究了不同商业连锁店的普及程度,揭示了商业的成功与多个因素有关。
Jun, 2013