Mar, 2024

InfiCoder-Eval:对代码大型语言模型的问题回答能力进行系统评估

TL;DR利用 InfiCoder-Eval 这个大规模的自由形式问答(QA)基准测试,我们系统评估了超过 80 种代码 LLMs,并取得了一系列富有洞察力的发现,同时展示了进一步改进代码 LLMs 的可能方向。