Oct, 2023

软件元数据的生成型人工智能:FIRE 2023 软件工程信息检索赛道综述

TL;DR在软件工程中的信息检索(IRSE)领域,通过基于人类和大型语言模型生成的标签的机器学习框架,开发代码注释自动评估的解决方案。通过对开源 Github 上的 C 语言项目提取的 9048 个代码注释和周围代码片段对进行二分类任务,将注释分类为有用和无用。来自各大学和软件公司的 17 支队伍总共提交了 56 个实验。通过 F1 - 得分定量评估实验结果,并根据开发的特征类型、使用的监督学习模型及其对应的超参数进行定性评估。大型语言模型生成的标签增加了预测模型的偏差,但能得到更少过拟合的结果。