Jun, 2023

大型语言模型在完成可能存在漏洞的代码上表现不佳

TL;DR介绍和研究有潜在 bug 的代码补全问题,引入两个数据集,发现潜在 bug 显著降低 Code-LLMs 的性能,调查了几种后处理方法,但效果有限。