Sep, 2024

语言无关语言推理的基准测试:Linguini

TL;DR本研究提出了一个新基准,旨在测量语言模型的语言推理能力,而无需依赖现有的特定语言知识。我们发现所有分析模型的准确率均低于25%,且开放模型与封闭模型之间存在显著差距,这突显了当前模型在低资源语言处理中的不足。