为单元测试用例学习有意义的断言语句

Feb, 2020

为单元测试用例学习有意义的断言语句

On Learning Meaningful Assert Statements for Unit Test Cases

Cody Watson, Michele Tufano, Kevin Moran, Gabriele Bavota, Denys Poshyvanyk

TL;DR利用神经机器翻译技术的 Atlas，能够自动生成恰当的断言语句来评估主方法的正确性，可作为自动生成测试用例技术的补充和开发人员的代码补全支持。

Abstract

software testing is an essential part of the software lifecycle and requires a substantial amount of time and effort. It has been estimated that software developers spend close to 50% of their time on testing the code they write. For these reasons, a long standing goal within the resea

software testing automated testing neural machine translation atlas assert statements

发现论文，激发创造

使用预训练 Transformer 生成准确的单元测试断言语句

本文提出了一种基于 Transformer 模型的方法，通过生成准确和有用的 assert 语句来支持开发人员编写单元测试用例，经实验证明，该模型在准确性和覆盖率上都具有较大的提升。

Sep, 2020

基于变形金刚和焦点环境的单元测试用例生成

AthenaTest 是一种通过学习从实际的焦点方法和开发人员编写的测试用例生成单元测试用例的方法，使用序列到序列学习任务，利用两步训练过程，通过自然语言和源代码的预训练以及围绕中心方法的聚焦上下文信息来提高验证损失，并且使用公开可用的最大的有监督平行单元测试用例方法语料库对其进行评估。测试结果表明，AthenaTest 方法优于 GPT-3，并具有与 EvoSuite 相当的覆盖率和良好的可读性和理解性。

Sep, 2020

利用大型语言模型进行计算机科学教育中学生代码引导的测试用例生成

我们提出了一种基于大型语言模型的自动测试用例生成方法，证明它们是衡量学生知识的良好指标，使用了一个包含学生编写的 Java 代码的公开数据集，并讨论了以测试用例帮助学生为中心的未来研究方向。

Feb, 2024

自动化行为测试在机器翻译中的应用

利用大型语言模型和行为测试的评估框架来检测机器翻译系统的行为，提出了一种通过针对不同场景生成多样的源句子、使用候选集进行验证的方法，并揭示使用准确率等传统度量指标难以察觉的重要差异和潜在错误。

Sep, 2023

在游戏开发中利用大型语言模型进行高效的故障分析

这篇论文提出了一种利用大型语言模型（LLMs）自动识别导致测试失败的代码更改的新方法，并通过定量和定性评估验证了该方法的有效性。通过 EA 开发者报告的问题进行的数据集评估结果显示，我们的方法在准确率上达到了 71％。此外，通过用户研究对我们的模型进行了评估，结果显示在开发者的视角下使用该工具可以显著减少问题调查所需的时间，最高可达 60％。

Jun, 2024

断言检测大型语言模型上下文学习 LoRA 微调

通过使用基于大量医学数据预训练的大型语言模型（LLMs）和先进的推理技术，我们介绍了一种用于检测医学概念的断言的新方法，该方法在传统方法的基础上进一步优化，并在无结构的临床文本中取得了良好的性能。

Jan, 2024

CAT-LM: 训练基于对齐的代码和测试的语言模型

CAT-LM 是一个使用 27 亿参数在 Python 和 Java 项目语料库上进行训练的新颖的预训练信号，通过考虑代码和测试文件之间的映射来生成与开发人员相似的测试代码，并且在生成测试完成时比更大的语言模型和最近的测试特定模型表现更好。

Oct, 2023

AssertionBench: 用于评估大语言模型的断言生成基准

使用大型语言模型（LLMs）生成断言的有效性和适用性的定量评估。

Jun, 2024

AEON: 自然语言处理测试用例自动评估方法

使用 AEON 工具对生成的测试用例进行语义相似性和语言自然度评估，从而提高测试用例的质量，最终帮助提高自然语言处理软件的准确性和稳健性。

May, 2022

智能自动化软件测试框架 TestLab

TestLab 是一款智能自动化软件测试框架，它使用人工智能来收集一组测试方法并将其自动化，以允许对软件系统进行连续的多层级测试，包括从开发人员到最终用户的不同层次，增强了传统自动化软件测试，可以通过源代码分析自动生成测试用例，旨在加速软件开发周期并减少漏洞

Jun, 2023