Aug, 2023
高资源编程语言到低资源编程语言的知识转移:面向代码语言模型的研究
Knowledge Transfer from High-Resource to Low-Resource Programming Languages for Code LLMs
Federico Cassano, John Gouwar, Francesca Lucchetti, Claire Schlesinger, Carolyn Jane Anderson...
TL;DR通过使用半合成数据的有效方法,本文提出了一种提高 Code LLMs 在低资源语言上性能的方法,应用于 Racket、OCaml 和 Lua,通过在 Stack 数据集上训练并使用 MultiPL-T 生成的数据,实现了最先进的性能。