Jul, 2023

基于机器学习系统中的缺陷特征化

TL;DR在这篇论文中,我们调查了 ML-based 软件系统中的 bug 特征以及与非 ML bug 相比的维护视角的差异,我们提取了使用 TensorFlow、Keras 和 PyTorch 这三种最流行的 ML 框架的 447,948 个 GitHub 存储库,然后通过多次过滤选择了具有最多已关闭问题的前 300 个存储库,并通过对 386 个抽样报告的问题进行手动检查,我们的研究发现,近一半的 ML-based 系统中报告的真实问题是 ML bug,表明与非 ML 组件相比,ML 组件更容易出错,因此在 ML-based 系统中,关注 ML 组件的可靠性非常重要。