Apr, 2024

关于基于嵌入的方法在代码生成中测量功能正确性的局限性

TL;DR使用嵌入式度量指标如 CodeBERTScore 来测量功能正确性和编辑工作量的能力分析。