BriefGPT.xyz
大模型
Ask
alpha
关键词
code models
搜索结果 - 4
基于神经网络的代码理解的重要性导向数据增强
通过引入通用的数据增强框架 GenCode,该论文提出了一种用于增强代码理解模型训练的方法,通过代码转换技术生成新的代码候选项,并利用重要性度量选择重要的代码作为训练数据,实验证明 GenCode 相比 MixCode 增强方法,在平均准确
→
PDF
4 months ago
CRUXEval:代码推理、理解和执行的基准评估
我们提供了 CRUXEval(代码推理、理解和执行评估)基准测试,包含 800 个 Python 函数(3-13 行)。每个函数都带有一个输入输出对,以进行输入预测和输出预测两个任务。我们评估了二十个代码模型,并发现许多在 HumanEva
→
PDF
6 months ago
Magicoder:只需源代码
Magicoder 是一系列全面开源(代码、权重和数据)的大型语言模型(LLMs),通过使用 OSS-Instruct 来提供更多样化、更真实和可控的数据,从而消除了合成数据的固有偏见,显著缩小了与顶级代码模型的差距。
PDF
7 months ago
针对预训练代码模型的自然攻击
本文提出了一种针对代码模型的黑盒对抗攻击方法 ALERT,通过在保留原始输入的基础上考虑代码的自然语义,使得对抗样本更符合人类判断,并在三项下游任务中取得了高攻击成功率,最后对对抗性微调的效果进行了研究。
PDF
2 years ago
Prev
Next