EMNLPNov, 2023
利用可比语料和多个参考文献进行代码翻译的数据增强
Data Augmentation for Code Translation with Comparable Corpora and Multiple References
Yiqing Xie, Atharva Naik, Daniel Fried, Carolyn Rose
TL;DR通过构建可比较的语料库和多重参考翻译,以及使用自动生成的翻译参考和单元测试进行筛选,我们提出了两种数据增强技术来克服不同编程语言之间的代码翻译挑战,并通过平均 7.5% 的计算准确度改进了 CodeT5 的 Java、Python 和 C++ 代码翻译性能。