Aug, 2023

模拟保险欺诈网络数据的引擎

TL;DR传统上,检测欺诈保险索赔依赖于商业规则和专家判断,这使得过程耗时且昂贵。因此,研究人员一直在研究开发高效准确的分析策略来标记可疑索赔。然而,在开发欺诈检测模型时,我们面临几个挑战,如欺诈的罕见性导致高类别不平衡,只有少数索赔得到调查和标记,导致大量未标记数据,以及公开可用数据的缺乏。因此,我们设计了一个模拟机器,用于创建与实际保险欺诈数据集相似的具有网络结构和可用协变量的合成数据。此模拟引擎使研究人员和从业者可以在各种不同的设置中检验多种方法学挑战以及测试他们的保险欺诈检测模型的(开发策略),同时还可以生成大量的合成数据集以评估(高级)机器学习技术的预测性能。