部署机器学习的挑战：案例研究调查

Nov, 2020

部署机器学习的挑战：案例研究调查

Challenges in Deploying Machine Learning: a Survey of Case Studies

Andrei Paleyes, Raoul-Gabriel Urma, Neil D. Lawrence

TL;DR该论文调查了部署机器学习模型在实际业务系统中可能遇到的挑战和关注点，并将这些挑战与机器学习部署工作流程的各个阶段对应起来，以期为解决这些挑战探索新的方法和研究方向。

Abstract

In recent years, machine learning has transitioned from a field of academic research interest to a field capable of solving real-world business problems. However, the deployment of →

machine learning deployment practical considerations workflow research agenda

发现论文，激发创造

部署临床机器学习？考虑以下事项

通过调查拥有临床部署经验的从业者，本研究针对临床机器学习应用程序的主要挑战类别进行了分类，以更好地设计和开发临床机器学习应用程序。

Sep, 2021

超越发展：部署机器学习模型用于结构工程应用的挑战

通过两个实例，本文旨在阐明开发适用于应用的机器学习模型的挑战，强调了通过自适应采样、物理学知识导向的特征选择以及考虑模型复杂性和泛化能力来实施严格的模型验证技术的重要性。

Apr, 2024

机器学习系统部署管道的持续学习

研究了机器学习系统的最小自动化部署技术，并比较了自动化部署技术的优劣，以帮助后来的采用者避免在实际使用案例中发生概括性错误，并选择更好的策略，同时提高机器学习系统的部署评估框架意识，有更全面、有用的评估指标，而不仅仅关注单一的因素，这对于行业决策者尤为重要。

Dec, 2022

机器学习资产管理的挑战的实证研究

通过分析开发者论坛和平台中的 15,065 个帖子，我们使用混合方法来分类查询、提取挑战并通过卡片排序和聚类方法找到解决方案，发现了与资产管理相关的 133 个主题，其中软件依赖、模型部署和模型训练是最常讨论的，同时也发现了 79 个解决方案主题，主要涉及软件依赖、特征开发和文件管理。这项研究强调了对已发现痛点的进一步探索的需要，以及学术界、行业和研究界之间协作努力的重要性。

Feb, 2024

生产环境模型的监控和可解释性

讨论机器学习模型周期的后续，重要的是在已经部署的模型上进行监控，包括模型的性能和数据监控，使用统计技术检测异常值和数据漂移，提供历史预测的解释，同时使用开源工具来实现这些目标。

Jul, 2020

构建基于机器学习的系统中的协作挑战：沟通，文档，工程和流程

该研究通过访谈 28 个组织中 45 位从业人员发现，在建立和部署机器学习系统时，团队在需求、数据和整合等方面都面临一些具体的协作挑战，主要来源于沟通、文档记录、工程和流程等方面，因此提出了一些建议以应对这些挑战。

Oct, 2021

通过将系统与机器学习集成，自动化 MLOps 中的模型训练和部署

本文介绍了机器学习在现实世界应用中的重要性，探讨了 MLOps（机器学习运营）的兴起及其在解决模型部署和性能监控等挑战方面的重要性。通过回顾 MLOps 的演变和其与传统软件开发方法的关系，论文提出了将该系统与机器学习相结合以解决现有 MLOps 面临的问题并提高生产力的方法。本文重点关注自动化模型训练的重要性，以及通过版本控制系统确保训练过程的透明性和可重复性的方法。此外，还讨论了将机器学习组件集成到传统 CI/CD 流水线中面临的挑战，并提出了版本环境和容器化等解决方案。最后，论文强调了模型部署后持续监控和反馈循环的重要性，以保持模型的性能和可靠性。本文运用 Netflix 的案例研究和最佳实践，提出了成功实施 MLOps 实践的关键策略和经验教训，并为其他组织构建和优化自己的 MLOps 实践提供了有价值的参考。

May, 2024

机器学习研究中的陷阱：重新审视开发周期

本研究从算法设计到数据收集到模型评估的全过程，引起注意常见陷阱，并提供实用建议以改进机器学习，通过案例研究强调这些缺陷在实践中如何发生以及在哪里可以进行改进。

Nov, 2020

有意义的机器学习

机器学习的研究应更加关注数据集、评估指标、以及研究结果在学科领域中的传播，作者提出了 6 个目标挑战以促进机器学习的实际应用。

Jun, 2012

循着最佳实践指引的机器学习

本文旨在通过分析机器学习在软件工程中的最佳实践，填补现有文献不足的空缺，并针对机器学习应用所面临的挑战和开发过程，提出一系列以软件工程视角为基础的建议。

Apr, 2023