May, 2021

使用APPS评估编码挑战能力

TL;DR通过引入APPs基准,对编程语言生成进展进行了评估,并发现当前机器学习模型已经开始学会编码,然而在生成Python代码时仍存在语法错误