Sep, 2024

HexaCoder:通过Oracle引导合成训练数据实现安全代码生成

TL;DR本研究解决了大语言模型生成代码中存在的严重安全漏洞问题。提出的HexaCoder方法通过自动合成安全代码,显著降低了寻找合适训练数据的工作量,并通过引导数据合成和双步骤生成过程,成功将生成的易受攻击代码减少了高达85%。该研究的成果不仅提高了生成代码的安全性,还确保了功能上的正确性。