Nov, 2024
自动数据集偏移识别以支持AI性能漂移的根本原因分析
Automatic dataset shift identification to support root cause analysis of
AI performance drift
TL;DR本研究针对临床AI模型在数据分布变化时性能显著下降的问题,提出了一种首个无监督数据集偏移识别框架,能够有效区分标签分布变化引起的流行偏移、输入特征变化导致的协变量偏移以及两者同时存在的混合偏移。研究表明,利用自监督编码器和任务模型输出结合的新型偏移检测器在三种不同影像模式下表现出色,能够促进对现实世界中五种数据集偏移类型的检测。