EMNLPJan, 2022

CodeRetriever: 用于代码搜索的单模态和双模态对比学习

TL;DR本文提出了 CodeRetriever 模型,通过大规模的代码 - 文本对比预训练学习功能级别的代码语义表示,并采用单模态对比学习和双模态对比学习两种对比学习方案,以通过文档、函数名称和代码 - 文本对建立语义相关的代码对和代码 - 文本对,在不同代码粒度的 11 个领域 / 语言特定的代码搜索任务中,CodeRetriever 取得了新的最高水平,有效性和鲁棒性得到证明。