Oct, 2023

SUT: 转换器模型的主动缺陷探测

TL;DR自动程序翻译具有巨大的应用价值,但当前的翻译模型在基本的语法错误方面仍存在问题。本论文介绍了针对编程语言翻译的新指标和一套包括高度可解释的评估工具的测试套件,实验证明即使是像 ChatGPT 这样强大的模型在基本单元测试上也存在错误。