Oct, 2022

将人工智能配对编程的离线度量与人类价值判断对齐

TL;DR研究表明,具有实现代码自动生成能力的大型语言模型的正确性及努力度均对程序员的价值有影响,建议设计出更人性化的评估指标以评估这些模型的优劣。