机器学习与持续集成

Apr, 2023

SoK: Machine Learning for Continuous Integration

Ali Kazemi Arani, Mansooreh Zahedi, Triet Huynh Minh Le, Muhammad Ali Babar

TL;DR本文对机器学习在自动化持续集成（CI）阶段中的应用进行了系统性知识总结，旨在弥补现有解决方案中的不足并推动领域技术的发展。

Abstract

continuous integration (CI) has become a well-established software development practice for automatically and continuously integrating code changes during software development. An increasing number of

continuous integration machine learning systemization of knowledge software development automation

发现论文，激发创造

机器学习在持续集成中的应用的系统文献综述

本研究对机器学习在持续集成中的应用进行了系统综述，探讨了其数据工程、特征工程、超参数调整、评估方法等方面。研究提供了研究者和从业者在持续集成中应用机器学习方法的有价值的见解，强调在这一领域需要进一步研究。

May, 2023

关于学习方法在持续集成中应用的系统文献综述

该研究综述了持续集成领域中基于学习的方法，探讨了自动化持续集成任务的分析以及相关技术和指标的应用和缺陷，为研究人员和从业者提供了有价值的洞见，并强调了在持续集成中进一步研究这些方法的重要性。

Jun, 2024

机器学习项目如何使用持续集成实践？基于 GitHub Actions 的实证研究

对 185 个开源项目进行综合分析，发现机器学习项目在持续集成方面存在独特挑战，如建立时间更长、测试覆盖率较低以及构建时间趋势增加的问题。研究通过定量和定性分析揭示了持续集成在机器学习和传统项目中的差异和讨论的主题。

Mar, 2024

机器学习治理

本文提出了机器学习治理的概念，并使用身份标识来确保机器学习系统的所有者对于系统的失败负责，从而增强人们对机器学习系统的信任，为未来的工作提供了机会。

Sep, 2021

循着最佳实践指引的机器学习

本文旨在通过分析机器学习在软件工程中的最佳实践，填补现有文献不足的空缺，并针对机器学习应用所面临的挑战和开发过程，提出一系列以软件工程视角为基础的建议。

Apr, 2023

人工智能模型持续开发的流程 —— 研究与实践当前状况

本文提供了一个综合的文献综述及九个半结构化采访，总结了 AI 模型持续开发中面临的挑战。作者提出了一种适用于 AI 持续开发的流水线，包含数据处理、模型学习、软件开发及系统运维四个阶段，并针对每个阶段的实施、适应和使用提出了具体挑战。

Jan, 2023

软件工程中机器学习的系统文献综述

应用机器学习技术研究软件工程领域的现状，特别关注软件质量保证、软件维护、软件理解和软件文档等方面。

Jun, 2024

通过将系统与机器学习集成，自动化 MLOps 中的模型训练和部署

本文介绍了机器学习在现实世界应用中的重要性，探讨了 MLOps（机器学习运营）的兴起及其在解决模型部署和性能监控等挑战方面的重要性。通过回顾 MLOps 的演变和其与传统软件开发方法的关系，论文提出了将该系统与机器学习相结合以解决现有 MLOps 面临的问题并提高生产力的方法。本文重点关注自动化模型训练的重要性，以及通过版本控制系统确保训练过程的透明性和可重复性的方法。此外，还讨论了将机器学习组件集成到传统 CI/CD 流水线中面临的挑战，并提出了版本环境和容器化等解决方案。最后，论文强调了模型部署后持续监控和反馈循环的重要性，以保持模型的性能和可靠性。本文运用 Netflix 的案例研究和最佳实践，提出了成功实施 MLOps 实践的关键策略和经验教训，并为其他组织构建和优化自己的 MLOps 实践提供了有价值的参考。

May, 2024

认证医疗系统中的机器学习连续设计控制

本研究介绍了一种使用拉请求作为设计控制方法的方法，并将这种方法应用于机器学习中的认证医疗系统中，利用模型卡作为监管审计跟踪。

Sep, 2022

用于大规模多任务动态 ML 系统的持续发展方法论

研究利用模块化模型和连续开发方法来生成多任务机器学习模型，以实现多次设计和评估迭代的整合，从而生成一个能够解决 124 个图像分类任务的机器学习模型，并达到了最优质量和改进的规模和计算成本。

Sep, 2022