COLINGApr, 2024

PECC:问题提取与编码挑战

TL;DR通过 PECC 我们引入了一个新的基准,从 Advent of Code (AoC) 和 Project Euler 派生,旨在评估大型语言模型对嵌入式问题的理解和生成可执行代码的能力,进而成为通用问题解决器。