Oct, 2023

语言无关代码嵌入

TL;DR本研究通过分析逐渐增长的跨语言代码模型的代码嵌入,展示了代码嵌入包含两个不同组成部分,一个与特定语言的细微差别和语法紧密相连,另一个则与此类细节无关,主要关注语义。此外,我们证明在去除特定语言组成部分后,下游代码检索任务有着显著改进,平均逆向排名 (MRR) 可达+17的绝对增益。