更好的机器学习工程能力

Nov, 2022

Capabilities for Better ML Engineering

Chenyang Yang, Rachel Brower-Sinning, Grace A. Lewis, Christian Kästner, Tongshuang Wu

TL;DR本文介绍了基于能力的框架，旨在使用机器学习模型行为的细粒度规范来统一现有的机器学习工程支持，并通过初步实验展示了能力对于反映模型通用性的潜力以及将其整合到机器学习工程的挑战和机遇。

Abstract

In spite of machine learning's rapid growth, its engineering support is scattered in many forms, and tends to favor certain engineering stages, stakeholders, and evaluation preferences. We envision a capability-b

machine learning engineering support capability-based framework model generalizability ml engineering

发现论文，激发创造

机器学习模型具备能力的含义

在本文中，我们利用大语言模型（LLMs）的能力作为运行示例，借鉴能力的大量哲学文献，发展了一个能有效应用于模型评估的机器学习模型能力的条件分析（CAMA）的核心提案，在机器学习的背景下对 CAMA 进行了精确定义，从而实现了适用于 LLMs 的 CAMA 操作。然后，我们运用 CAMA，展示它能够有助于理解机器学习模型评估实践的各种特征，并提出了进行公正的模型间比较的程序。

May, 2024

机器学习增强的系统工程中的问题命名

通过国际调查，本研究提供了机器学习应用系统工程的现状和问题，推动软件工程实践的进一步应用和传播，以提升机器学习应用系统的工程水平。

May, 2024

为基于模型的 AI 工程开启自动化机器学习

本文提出了一种新方法，支持自动化机器学习，帮助软件工程师在不需要深入了解人工智能的情况下，选择适当的机器学习模型、算法和技术以及适当的超参数来开发人工智能密集型系统，并进行智能能源领域的案例研究。

Mar, 2022

机器学习系统的技术成熟度水平

介绍了一种名为 “机器学习技术准备级别” 的系统工程方法，可确保机器学习方法的可靠性和有效性，同时优化产品化和部署过程。

Jan, 2021

超越发展：部署机器学习模型用于结构工程应用的挑战

通过两个实例，本文旨在阐明开发适用于应用的机器学习模型的挑战，强调了通过自适应采样、物理学知识导向的特征选择以及考虑模型复杂性和泛化能力来实施严格的模型验证技术的重要性。

Apr, 2024

一种建模机器学习工程过程的框架

为解决机器学习软件开发复杂性和多学科团队间的沟通问题，本文介绍了基于领域专用语言的机器学习软件开发流程模型框架，该框架通过标准化任务编排、促进沟通、培养协作环境等方式减轻挑战。

Apr, 2024

构建基于机器学习的系统中的协作挑战：沟通，文档，工程和流程

该研究通过访谈 28 个组织中 45 位从业人员发现，在建立和部署机器学习系统时，团队在需求、数据和整合等方面都面临一些具体的协作挑战，主要来源于沟通、文档记录、工程和流程等方面，因此提出了一些建议以应对这些挑战。

Oct, 2021

揭示语言模型能力结构

本研究通过贝叶斯和频率分析结合，从 29 个 LLM 的数据中分析出 LLMs 的能力结构，发现 LLMs 的能力不是单一的，而是可以被解释为三个能力：推理、理解和核心语言建模，并且这三个能力可以解释模型性能的高比例差异，可以用来指导模型的改进和评测。

Jun, 2023

可扩展的端到端机器学习平台：从自动机器学习到自助式服务

研究探讨了机器学习平台的发展、可伸缩性以及实现自助服务质量的要求和能力，并结合两个商业化的端到端机器学习平台来说明其推广应用及未来发展的目标。

Feb, 2023

应用软件工程技术实现应用机器学习的指导

研究指出，现有的机器学习开发环境和 API 缺乏足够的指导及软件工程最佳实践，需要在专门开发的机器学习应用程序开发方面扩展和适应软件工程概念、工具和技术，并为机器学习特定的软件工程提供充足的研究机会。

Mar, 2022