机器学习新领域:MLOps 政策制定者指南
这篇论文研究了机器学习运营(MLOps)方法的重要性,以及如何选择最佳的工具结构来简化软件开发,并评估了各种 MLOps 方法的特性和可操作性。作者通过评估 22 篇相关论文发现,目前缺乏完全有效的 MLOps 方法,这些方法可以在不涉及人工干预的情况下实现自我调节的进步。
Aug, 2023
该研究详细介绍了 MLOps,它的好处,困难,演变以及重要的底层技术,如 MLOps 框架,Docker,GitHub 动作和 Kubernetes。该文章还侧重于使用各种成熟度水平的自动化管道的 ML 项目的端到端生产。它提供了一个企业级 MLOps 项目的详细示例,以解释技术在实际场景中的工作流程。
May, 2023
本文旨在通过文献综述、工具综述以及专家访谈的研究方法,提供了机器学习运营的定义、必要原则、部件及角色,及其架构和工作流程的综合概述,并强调了该领域的开放性挑战,为想要用指定的技术来自动化和操作他们的机器学习产品的研究人员和从业者提供了指导。
May, 2022
运用 DevOps 实践于机器学习系统,被称为 MLOps,其目的是建立不同开源工具之间的连接,构建一个能自动执行步骤来构建数据集、训练机器学习模型并将模型部署到生产环境的流水线,并存储不同版本的模型和数据集。本文提出了一个基于上下文信息(例如数据性质、数据类型)的推荐系统框架,用于为机器学习系统的操作化推荐相关的技术栈,通过对四种不同方法的调查,即基于规则的、随机森林、决策树和 K 最近邻,以准确率、召回率和 F1 分数进行评估,其中随机森林的 F1 分数最高,为 0.66。
Feb, 2024
本篇论文旨在通过对视觉隐私问题的分析,系统地研究机器学习流程中的公平性、隐私、人类干预以及潜在的社会伦理问题,从而提高相关利益相关者(研究人员,模型构建者,企业等)的认识与责任意识。
Nov, 2021
本文旨在通过综合调查,以 MLOps 为过程,收集和阐述关键概念和活动及其代表作和调查,对现有机器学习技术的现状进行清晰的阐述,以便初学者(如研究人员、从业人员)了解 MLOps 过程的概述,以及在 ML 过程的每个步骤中使用的关键技术,并了解如何查找更多详细信息。
Apr, 2023
本文介绍了机器学习在现实世界应用中的重要性,探讨了 MLOps(机器学习运营)的兴起及其在解决模型部署和性能监控等挑战方面的重要性。通过回顾 MLOps 的演变和其与传统软件开发方法的关系,论文提出了将该系统与机器学习相结合以解决现有 MLOps 面临的问题并提高生产力的方法。本文重点关注自动化模型训练的重要性,以及通过版本控制系统确保训练过程的透明性和可重复性的方法。此外,还讨论了将机器学习组件集成到传统 CI/CD 流水线中面临的挑战,并提出了版本环境和容器化等解决方案。最后,论文强调了模型部署后持续监控和反馈循环的重要性,以保持模型的性能和可靠性。本文运用 Netflix 的案例研究和最佳实践,提出了成功实施 MLOps 实践的关键策略和经验教训,并为其他组织构建和优化自己的 MLOps 实践提供了有价值的参考。
May, 2024
机器学习在工业部门中成为了一个流行工具,用于提升运营效率、增加效能和降低成本。然而,在生产环境中部署和管理机器学习模型可能十分复杂,因此机器学习运维 (MLOps) 的出现旨在简化这个过程。我们开发了一种新型的 MLOps 软件架构,以解决将解释和反馈功能整合到机器学习开发和部署过程中的挑战,并在工业应用案例中实施。该软件架构提供了高效管理生产环境中机器学习模型的方式,同时允许将解释整合到开发和部署过程中。
Sep, 2023