May, 2022

预测交通事故中的重伤程度:新的不平衡数据集和基准

TL;DR本文介绍了一种新的数据集,用于评估机器学习算法在交通事故中预测伤势严重性方面的表现。数据集通过聚合英国交通部的公开数据集来创建,这些数据集在数据维度上具有极度不平衡以及有时缺少高达 50%的属性,可以通过 MissForest 模型处理。本文还介绍了两种基准方法来创建伤害预测器:一种是监督的人工神经网络,另一种是强化学习模型。该数据集可以刺激机器学习研究在不平衡数据集方面的多个方面,并且这两种方法可以用作在这个领域测试更高级学习算法时的基准参考。