监控机器学习模型:在线检测相关偏差
ML Health 为监测机器学习模型预测性能潜在下降提出了一种诊断方法,并将该方法应用于一种实现了全生产生命周期的系统中,来自动化追踪并生成进一步调查的警报。
Feb, 2019
在这项工作中,我们分析了两种不同的异常检测模型维护技术的模型更新频率,即盲目模型重训练和知情模型重训练。此外,我们还研究了通过对所有可用数据(全历史方法)或仅对最新数据(滑动窗口方法)进行重新训练来更新模型的效果,并且调查了一个数据变化监控工具能否确定何时需要通过重新训练更新异常检测模型。
Nov, 2023
讨论机器学习模型周期的后续,重要的是在已经部署的模型上进行监控,包括模型的性能和数据监控,使用统计技术检测异常值和数据漂移,提供历史预测的解释,同时使用开源工具来实现这些目标。
Jul, 2020
通过将因果推断和统计过程控制方法结合起来,我们以术后恶心呕吐的风险预测算法为案例研究,定义候选监测标准、描述潜在偏差和因果模型,并具体说明和比较候选监测程序,以此作为发展比较各种监测选项的框架的第一步。
Nov, 2023
通过将数据监督引入机器学习预测模型,我们提出了一种实时模型无关的方法,评估机器学习预测的相对可靠性,并通过针对操作数据集与训练数据集之间的差异来计算预测的相对可靠性,用以支持机器学习预测在常规插值任务中的可信度。
Aug, 2023
通过使用退化数据集和机器学习,本文介绍了一个用于为机器学习组件创建安全监视器的过程,该安全监视器与自主系统并行部署,以提供模型输出的安全风险预测。我们通过使用公开可用的速度标志数据集进行一些初步实验,证明了我们方法的可行性。
Jun, 2024
使用自动机器学习工具箱广泛比较了传统机器学习方法和深度学习在条件监测任务中的表现,实验结果显示,在所有测试模型中,随机 K 折交叉验证方案始终保持高准确率。然而,当在同样的数据集上采用留一组出交叉验证时,没有明确的优胜者,表明在真实场景中存在领域转移。此外,本研究评估了传统方法和神经网络的可扩展性和可解释性,传统方法通过模块化结构提供了可解释性,有助于特征识别,而神经网络则需要专门的解释技术,如遮挡映射来可视化输入数据中的重要区域。最后,本文强调了特征选择的重要性,特别是在具有有限类别变化的条件监测任务中。对于这种任务,低复杂度模型足够使用,通常只需要从输入信号中的几个特征。总之,这些发现为各种方法的优点和局限性提供了关键见解,提供了有价值的基准,并确定了最适合条件监测应用的方法,从而增强了其在真实世界场景中的适用性。
Aug, 2023
该教程主要关注以机器学习为基础的预测性监测,介绍了一种有效的方法来检测系统在当前状态下对给定要求的潜在违规情况,并提出使用深度学习和符合预测方法来解决计算效率和可靠性的挑战。
Dec, 2023