Nov, 2023

从非现实数据学习缺陷预测

TL;DR通过提取高维嵌入并评分人工样本相对于最接近的真实世界样本的距离,我们展示了在基于代码的两个流行预训练模型上训练仅包含表示最相似样本且舍弃与表示完全不相似样本的方法对两个代码理解任务取得了一致的改进。