Sep, 2024
L3Cube-IndicQuest:评估大型语言模型在印度背景下知识的问答基准数据集
L3Cube-IndicQuest: A Benchmark Questing Answering Dataset for Evaluating
Knowledge of LLMs in Indic Context
TL;DR本研究解决了评估大型语言模型(LLMs)在印地语区知识掌握能力的缺乏基准数据集的问题。提出的L3Cube-IndicQuest数据集包含200个涵盖19种印地语言的问答对,旨在量化评估多语言LLMs在理解和呈现印度特定知识方面的表现。此数据集的发布将为相关领域的研究提供标准参照,促进LLMs的进一步发展。