May, 2021

使用 APPS 评估编码挑战能力

TL;DR通过引入 APPs 基准,对编程语言生成进展进行了评估,并发现当前机器学习模型已经开始学会编码,然而在生成 Python 代码时仍存在语法错误