Jan, 2022

Synchromesh:基于预训练语言模型的可靠代码生成

TL;DR本文提出了Synchromesh作为一种增强预训练语言模型在代码生成中可靠性的框架。它通过Target Similarity Tuning选择语义上相似的训练样例,并采用Constrained Semantic Decoding方法在不需要额外训练的前提下约束输出代码的合法性,从而提高了模型的实用性和运行效率。作者在使用GPT-3和Codex两种模型在SQL查询、Vega-Lite可视化和SMCalFlow编程语言中进行实验,展示了CSD在约束语义、范围、类型规则和上下文逻辑等方面的有效性。