Aug, 2023

OctoPack:指令优化大型语言模型代码

TL;DR通过对指令进行细调,利用代码进行指令调整,以提升大型语言模型(LLMs)在自然语言任务中的性能表现,并在 Git 提交中利用人类指令的自然结构进行指令调整,实现了在 16B 参数 StarCoder 模型上超过其他自然和合成代码指令(xP3x,自我指导,OASST)的最新性能,即在 HumanEval Python 基准测试中达到 46.2%的一次通过率。