研究机器学习软件测试实践
本文综述了 144 篇关于机器学习测试(ML Testing)的研究论文,涵盖了测试属性(如正确性,鲁棒性和公平性)、测试组件(如数据、学习程序和框架)、测试工作流(如测试生成和测试评估)和应用场景(如自动驾驶、机器翻译)。研究还分析了数据集、研究趋势和研究重点的趋势,并得出了 ML 测试中的研究挑战和有前景的研究方向。
Jun, 2019
深度学习技术在各个领域极大地方便了人们的生活,但深度学习库作为这些系统的支柱,同样会受到漏洞的威胁。本文提供了与深度学习库相关的测试研究概述,讨论了现有方法的优势、劣势,并为深度学习库的应用提供指导和参考,同时还总结了针对这些库的现有测试方法和工具,分析了其有效性和局限性,并探讨了深度学习库测试的挑战和未来的研究方向。
Apr, 2024
本研究提出了一种专为深度学习系统设计的突变测试框架,通过注入故障来度量测试数据的质量,并在 MNIST 和 CIFAR-10 数据集上验证了其有效性。
May, 2018
研究调查了 10 家奥地利中小型企业在开发人工智能 / 机器学习组件和代码时采用的软件质量保证策略,发现质量问题在何时出现并如何检测,同时识别了 12 个开发 AI/ML 组件时存在的问题,为未来 AI/ML 组件的软件质量保证流程提供指导。
Mar, 2022
深度学习模型的单元测试对于开源 DL 项目的可靠性至关重要,研究表明,单元测试 DL 项目在开源项目指标上具有积极的相关性和更高的合并请求接受率,但有 68% 的抽样 DL 项目没有进行单元测试。
Feb, 2024
本研究为了解决工业生产系统中机器学习模型的质量检验问题,提出了基于模块化策略的数据完整性及数据质量的质量保证方法,并以工业合作案例为支撑,还提出了未来研究的几个挑战。
Nov, 2022