Aug, 2024

一种编码代码和辅助代码理解的新方法

TL;DR本研究探讨了目前主流模型在代码理解中的局限性,尤其是它们在推理和生成新代码方面的不足。论文提出了一种全新的编码范式,基于异构图像的方法来实现代码理解,通过自监督学习在大规模文本-代码对上进行训练,从而在零样本预测上取得重大突破。该方法为未来通过扩散技术生成代码铺平了道路,避免了自回归模型的限制。