software testing is an essential part of the software lifecycle and requires
a substantial amount of time and effort. It has been estimated that software
developers spend close to 50% of their time on testing the code they write. For
these reasons, a long standing goal within the resea
这篇论文提出了一种利用大型语言模型(LLMs)自动识别导致测试失败的代码更改的新方法,并通过定量和定性评估验证了该方法的有效性。通过 EA 开发者报告的问题进行的数据集评估结果显示,我们的方法在准确率上达到了 71%。此外,通过用户研究对我们的模型进行了评估,结果显示在开发者的视角下使用该工具可以显著减少问题调查所需的时间,最高可达 60%。