May, 2023

通过代码搜索:新的代码片段搜索数据集和 SnippeR 检索模型

TL;DR提出了一个新的 SearchBySnippet 数据集并建立了一个单一编码器模型 SnippeR,用于针对代码搜索的基准测试。在这一设置中,现有的架构即使是经过精细调整后也远远不及最简单的 BM25 基准。