EMNLPOct, 2023

CodeTransOcean:一项用于代码翻译的全面多语言基准

TL;DR为了推动代码翻译研究并满足实际应用的多样需求,构建了支持最多语言的大规模综合基准 CodeTransOcean,其中包括了多种新颖的多语种数据集,以及用于评估编译性能的新颖交叉框架数据集 DLTrans。还展示了多语种建模方法在提高低资源和高资源语言对的翻译质量和训练效率方面的巨大潜力,提出了一个用于程序级代码翻译的新型评估指标 Debugging Success Rate@K,并对未来研究的代码翻译挑战进行了分析。