机器学习中的可维护性挑战：系统性文献综述

Aug, 2024

机器学习中的可维护性挑战：系统性文献综述

Maintainability Challenges in ML: A Systematic Literature Review

Karthik Shivashankar, Antonio Martini

TL;DR本研究旨在识别和综合机器学习工作流程中不同阶段的可维护性挑战，并分析这些阶段之间的相互依赖性和影响。通过系统性文献综述，研究揭示了13个可维护性挑战及其对整体工作流程的影响，帮助开发者和研究人员优化机器学习系统的可维护性。

Abstract

Background: As Machine Learning (ML) advances rapidly in many fields, it is being adopted by academics and businesses alike. However, ML has a number of different Challenges in terms of maintenance not found in t

发现论文，激发创造

部署机器学习的挑战：案例研究调查

该论文调查了部署机器学习模型在实际业务系统中可能遇到的挑战和关注点，并将这些挑战与机器学习部署工作流程的各个阶段对应起来，以期为解决这些挑战探索新的方法和研究方向。

Nov, 2020

机器学习系统中的不匹配特征和检测

本文研究了机器学习在软件系统中的应用，指出了机器学习开发和部署中的三个方面：数据科学、软件工程和运营，及其不当的假设可能导致系统失败，通过调查收集了一组共同的不匹配类型，并且发现每个角色对相关不匹配的重要性的优先级不同，这些发现将有助于提高机器学习能力的系统化发展。

Mar, 2021

构建基于机器学习的系统中的协作挑战：沟通，文档，工程和流程

该研究通过访谈28个组织中45位从业人员发现，在建立和部署机器学习系统时，团队在需求、数据和整合等方面都面临一些具体的协作挑战，主要来源于沟通、文档记录、工程和流程等方面，因此提出了一些建议以应对这些挑战。

Oct, 2021

应用软件工程技术实现应用机器学习的指导

研究指出，现有的机器学习开发环境和 API 缺乏足够的指导及软件工程最佳实践，需要在专门开发的机器学习应用程序开发方面扩展和适应软件工程概念、工具和技术，并为机器学习特定的软件工程提供充足的研究机会。

Mar, 2022

循着最佳实践指引的机器学习

本文旨在通过分析机器学习在软件工程中的最佳实践，填补现有文献不足的空缺，并针对机器学习应用所面临的挑战和开发过程，提出一系列以软件工程视角为基础的建议。

Apr, 2023

机器学习系统的最佳实践：分析和优化的工业框架

该研究论文提出了一个用于分析机器学习系统中软件工程最佳实践集的质量影响和优先级的框架，并介绍了适用于ML系统的分层软件质量模型(SQM)。通过应用集函数优化技术，可以回答哪些实践集可以最大程度地增加SQM覆盖范围，哪些是最重要的，应该实施哪些实践以改善特定的质量方面。

Jun, 2023

基于机器学习系统中的缺陷特征化

在这篇论文中，我们调查了ML-based软件系统中的bug特征以及与非ML bug相比的维护视角的差异，我们提取了使用TensorFlow、Keras和PyTorch这三种最流行的ML框架的447,948个GitHub存储库，然后通过多次过滤选择了具有最多已关闭问题的前300个存储库，并通过对386个抽样报告的问题进行手动检查，我们的研究发现，近一半的ML-based系统中报告的真实问题是ML bug，表明与非ML组件相比，ML组件更容易出错，因此在ML-based系统中，关注ML组件的可靠性非常重要。

Jul, 2023

基于模型驱动的机器学习组件工程：一项系统性文献综述

这项系统文献综述研究了MDE和机器学习（MDE4ML）交叉领域，分析了现有的研究动机、MDE解决方案、评估技术、关键优势和局限性，并提供了未来研究的建议。

Nov, 2023

机器学习增强的系统工程中的问题命名

通过国际调查，本研究提供了机器学习应用系统工程的现状和问题，推动软件工程实践的进一步应用和传播，以提升机器学习应用系统的工程水平。

May, 2024

机器学习驱动的软件系统中模型集成的大规模研究

本研究解决了目前对机器学习（ML）驱动的软件系统特征了解不足的问题。通过对2928个开源系统的分类与分析，提出了一种新的研究思路，揭示了ML模型的嵌入与集成实践。研究结果为从业者和研究人员提供了重要见解，促进数据科学与软件工程的结合。

Aug, 2024