Mar, 2024
半指导:连接自然指导和自我指导的大型编码语言模型
Semi-Instruct: Bridging Natural-Instruct and Self-Instruct for Code
Large Language Models
TL;DR指令调优在大规模代码语言模型(Code LLMs)中对程序合成任务至关重要。本文提出一种名为Semi-Instruct的方法,通过将自然指令中不规范代码转化为正确的指令-代码对,并设计了一种新颖的测试用例构建方法来验证生成代码的正确性。实验结果显示,Semi-Instruct方法在数据规模增加时性能稳定提高。