机器学习与持续集成
本研究对机器学习在持续集成中的应用进行了系统综述,探讨了其数据工程、特征工程、超参数调整、评估方法等方面。研究提供了研究者和从业者在持续集成中应用机器学习方法的有价值的见解,强调在这一领域需要进一步研究。
May, 2023
该研究综述了持续集成领域中基于学习的方法,探讨了自动化持续集成任务的分析以及相关技术和指标的应用和缺陷,为研究人员和从业者提供了有价值的洞见,并强调了在持续集成中进一步研究这些方法的重要性。
Jun, 2024
对 185 个开源项目进行综合分析,发现机器学习项目在持续集成方面存在独特挑战,如建立时间更长、测试覆盖率较低以及构建时间趋势增加的问题。研究通过定量和定性分析揭示了持续集成在机器学习和传统项目中的差异和讨论的主题。
Mar, 2024
本文提供了一个综合的文献综述及九个半结构化采访,总结了 AI 模型持续开发中面临的挑战。作者提出了一种适用于 AI 持续开发的流水线,包含数据处理、模型学习、软件开发及系统运维四个阶段,并针对每个阶段的实施、适应和使用提出了具体挑战。
Jan, 2023
本文介绍了机器学习在现实世界应用中的重要性,探讨了 MLOps(机器学习运营)的兴起及其在解决模型部署和性能监控等挑战方面的重要性。通过回顾 MLOps 的演变和其与传统软件开发方法的关系,论文提出了将该系统与机器学习相结合以解决现有 MLOps 面临的问题并提高生产力的方法。本文重点关注自动化模型训练的重要性,以及通过版本控制系统确保训练过程的透明性和可重复性的方法。此外,还讨论了将机器学习组件集成到传统 CI/CD 流水线中面临的挑战,并提出了版本环境和容器化等解决方案。最后,论文强调了模型部署后持续监控和反馈循环的重要性,以保持模型的性能和可靠性。本文运用 Netflix 的案例研究和最佳实践,提出了成功实施 MLOps 实践的关键策略和经验教训,并为其他组织构建和优化自己的 MLOps 实践提供了有价值的参考。
May, 2024
研究利用模块化模型和连续开发方法来生成多任务机器学习模型,以实现多次设计和评估迭代的整合,从而生成一个能够解决 124 个图像分类任务的机器学习模型,并达到了最优质量和改进的规模和计算成本。
Sep, 2022