Jun, 2024

BertaQA:语言模型对本地文化了解多少?

TL;DR大型语言模型在全球范围或以英文为中心的主题上表现出广泛知识,但对于在网上不那么突出的其他文化相关主题表现如何仍存在疑问。通过引入英文和巴斯克文平行的选择题数据集 BertaQA,我们发现一流的大型语言模型在本地文化知识上表现出困难,但持续的巴斯克文预训练显著提高了英文查询下模型在巴斯克文化方面的表现,这是低资源语言向高资源语言的知识传递的首个确凿证据。我们的分析揭示了语言和知识之间复杂的相互作用,并发现某些先前的发现在重新评估地方主题时不完全成立。我们的数据集和评估代码可在此 https URL 下的开放许可下获取。