COLINGFeb, 2024

RoCode: 从问题定义中测量代码智能的数据集(罗马尼亚语)

TL;DRRoCode 是一个包含 2642 个以罗马尼亚语编写的问题,11000 个使用 C、C++ 和 Python 编写的解决方案以及针对每个问题的全面测试套件的竞争编程数据集,旨在提供一个用于评估在罗马尼亚语 / 多语言文本上训练的语言模型的代码智能性的基准,并作为预训练罗马尼亚模型的微调集。通过我们的结果和对相关工作的评论,我们主张有必要开发除英语以外的其他语言的代码模型。