Oct, 2023

语言模型是否能使用苏格拉底方法?代码调试实验

TL;DR通过创建数据集并使用不同的语言模型进行基准测试,我们介绍了一个多轮 Socratic 建议的手动数据集,旨在帮助初学者程序员修复简单计算问题的错误解决方案,以及自动化 Socratic 对话代理的调试能力评估。