Jun, 2022

CodeS: 面向分布偏移下的代码模型泛化

TL;DR本文提出了 CodeS, 一个用于源代码学习的分布式模型的测试基准数据集,实验证明,在源代码任务中,其他领域的模型无法普遍适用,所有的代码分类模型都存在分布转变且受到表示性分布的影响更大,而预训练的双模型相对分布分离的适应性较强。