Nov, 2024
面向软件工程的开放源代码机器学习模型和数据集分类研究
Towards a Classification of Open-Source ML Models and Datasets for
Software Engineering
TL;DR本文解决了开放源代码预训练模型和数据集在软件工程中的分类不足的问题,提出了针对软件工程需求的分类方法。研究发现,目前大多数模型和数据集聚焦于代码生成和软件开发,强调了在软件管理任务中关注的不足,并指出自2023年第二季度以来,针对软件工程的预训练模型数量显著增加。这表明亟需扩展任务覆盖面,以提升机器学习在软件工程中的应用整合。