Feb, 2024

用语义保持变换评估程序修复:一种自然性评估方法

TL;DR研究通过人工调查探讨了语义保持转换的自然性对 NPR(Naturalness of Program Repairs)系统评估的影响,发现 60% 的转换被认为是自然的,20% 的转换被认为是不自然的,这些不自然的转换对 NPR 系统的稳健性测试造成了 25.2% 的误报率,并且 NPR 系统在自然转换下的性能显著下降,提出了一种基于交叉熵的新的自然度度量标准,并成功实现了代码转换的自然度的自动评估。