Mar, 2024

IRCoder: 中间表示使语言模型具有鲁棒性的多语言代码生成器

TL;DR通过利用编译器中间表示来改进代码语言模型的多语言能力,并促进跨语言转换,该研究探讨了在代码语言模型中利用编译器中间表示的可行性和优势,构建了一个并行数据集 SLTrans,并通过对不同规模的代码语言模型进行连续因果语言建模训练,从而在各种代码生成任务和度量标准中实现了显著和一致的提升。