BriefGPT.xyz
大模型
Ask
alpha
关键词
quality issues
搜索结果 - 3
代码生成中使用的提示的质量评估
评估大型语言模型在代码生成方面的效果时,需要使用健全的基准测试,而不严谨的评估基准会提供虚假的性能表现。本研究分析了 9 个代码生成基准中的 3,566 个提示,以确定其中的质量问题,并研究了修复这些问题对模型性能的影响。发现评估基准主要侧
→
PDF
3 months ago
高质量代码生成的轻量级框架
FRANC 是一个轻量级框架,用于推荐从基于 Transformer 的代码生成模型生成的更安全、更高质量的源代码,其中包括静态筛选器,质量感知排名器和提示工程学。在五个 Python 和 Java 代码生成模型和六个提示数据集上进行了评估
→
PDF
a year ago
AI 工程师的软件质量是什么?走向迷雾的消解
研究调查了 10 家奥地利中小型企业在开发人工智能 / 机器学习组件和代码时采用的软件质量保证策略,发现质量问题在何时出现并如何检测,同时识别了 12 个开发 AI/ML 组件时存在的问题,为未来 AI/ML 组件的软件质量保证流程提供指导
→
PDF
2 years ago
Prev
Next