Oct, 2023

神经测试神谕生成评估指标评估

TL;DR通过对现有的预言生成研究以及 ChatGPT 的再分析,研究探讨了它们在基于自然语言生成(NLG)和测试充分性度量方面的性能状况。结果发现 NLG 和测试充分性度量之间没有明显的相关性,通过定性分析找到了一些原因,并提供了更好评估软件测试生成中深度学习应用的指南。