Oct, 2024

用英语询问更佳:对大型语言模型在英语、低资源和跨语言环境中的评估

TL;DR本研究针对大型语言模型(LLMs)主要在英语环境中评估的不足,特别是对南亚低资源语言的探讨进行了深入分析。研究采用了零-shot 提示和五种不同的提示设置,结果表明,GPT-4在各语言模式下均优于Llama 2和Gemini,且所有三种模型在英语提示下表现优于其他低资源语言提示。这一发现强调了针对低资源语言的LLMs改进需求,以推动更通用的自然语言处理应用的发展。