code models | BriefGPT - AI 论文速递

关键词code models

搜索结果 - 4

基于神经网络的代码理解的重要性导向数据增强
通过引入通用的数据增强框架 GenCode，该论文提出了一种用于增强代码理解模型训练的方法，通过代码转换技术生成新的代码候选项，并利用重要性度量选择重要的代码作为训练数据，实验证明 GenCode 相比 MixCode 增强方法，在平均准确
PDF4 months ago
CRUXEval：代码推理、理解和执行的基准评估
我们提供了 CRUXEval（代码推理、理解和执行评估）基准测试，包含 800 个 Python 函数（3-13 行）。每个函数都带有一个输入输出对，以进行输入预测和输出预测两个任务。我们评估了二十个代码模型，并发现许多在 HumanEva
PDF6 months ago
Magicoder：只需源代码
Magicoder 是一系列全面开源（代码、权重和数据）的大型语言模型（LLMs），通过使用 OSS-Instruct 来提供更多样化、更真实和可控的数据，从而消除了合成数据的固有偏见，显著缩小了与顶级代码模型的差距。
PDF7 months ago
针对预训练代码模型的自然攻击
本文提出了一种针对代码模型的黑盒对抗攻击方法 ALERT，通过在保留原始输入的基础上考虑代码的自然语义，使得对抗样本更符合人类判断，并在三项下游任务中取得了高攻击成功率，最后对对抗性微调的效果进行了研究。
PDF2 years ago