Jan, 2024

大规模公共卫生数据流中的异常值排名

TL;DR基于大规模公共卫生数据流,我们提出了一种新的算法任务,利用层次网络和极值分析,对任意单变量方法在每个流中的输出进行排名,以帮助专家区分最重要的离群值。通过公共卫生数据流的人工专家评估,我们的新算法在传统的离群值检测指标上表现最佳。自 2023 年 4 月以来,专家已开始使用我们的开源 Python 实现,汇报比之前的基准快 9.1 倍找到值得调查的离群值。其他组织可以轻松采用这个实现,从他们量身定制的单变量方法的输出中创建排名。