Jan, 2024

利用增强学习和语义奖励的 LLM 驱动代码漏洞修复

TL;DR我们引入了一种多用途的代码漏洞分析系统 SecRepair,由一个大型语言模型 CodeGen2 提供支持,帮助开发人员识别和生成修复后的代码,并附带一个完整的漏洞描述和代码评论。我们的创新方法利用增强学习范式来生成由语义奖励机制增强的代码评论。研究结果强调,将增强学习与语义奖励结合起来,提高了模型在处理代码漏洞方面的能力和效果。