BriefGPT.xyz
大模型
Ask
alpha
关键词
programmer productivity
搜索结果 - 4
RealHumanEval: 评估大型语言模型对程序员的支持能力
通过使用 RealHumanEval、静态基准以及优先度度量,研究了大型语言模型(LLMs)在代码编写中的效能表现以及对程序员生产力的影响。发现优化的基准性能可以提高程序员的生产力,但基准性能与人类表现之间的差距并不成比例,同时程序员的偏好
→
PDF
3 months ago
何时展示建议?融合人类反馈的 AI 辅助编程
利用程序员与 Copilot 交互的先前数据,提出了一种基于效用理论框架的条件提示显示方案,利用预测模型来决定何时和显示何种建议,该方案可用于提高人类与大型语言模型交互的表现。
PDF
a year ago
MM
神经代码自动补全的生产力评估
本研究对使用 GitHub Copilot 的用户进行了调查,并研究了其对程序员生产率的影响,发现显示建议被接受的速率是开发人员感知到的生产率的驱动因素。
PDF
2 years ago
从真实世界数据集中学习自动完成
通过在真实的代码完成实例上训练模型,我们研究了代码完成的预测性能,并发现这些模型比在源代码和工作版本快照上训练的模型分别提高了 12.8% 和 13.8% 的准确性,这与程序员实际自动完成使用率增加 6.2% 相对应,证明了真实的代码完成示
→
PDF
4 years ago
Prev
Next