ICLRMar, 2023

自然语言规格说明到数学程序的综合

TL;DR研究评估了使用数据增强、后处理和代码生成模型 CodeT5 合成数学程序的效果,通过应用线性规划规则来评分和纠正光束,该方法基于自然语言规范实现自动化建模。实验结果表明,在使用这些增强方法后,CodeT5 基础版本的执行准确率为 0.73,明显优于 ChatGPT 的零 - shot 执行准确率 0.41 和 Codex 的 0.36。