EMNLPSep, 2021

CodeT5: 面向标识符的统一预训练编码器 - 解码器模型用于代码理解与生成

TL;DRCodeT5 是一个基于编码器 - 解码器的统一预训练 Transformer 模型,它充分利用了开发人员分配的标识符所传达的代码语义,通过支持代码理解和生成任务以及多任务学习等方面,显著优于先前的方法,并且在代码缺陷检测和克隆检测等理解任务以及 PL-NL,NL-PL 和 PL-PL 等不同方向的生成任务中表现出色。