Jan, 2024

MERA: 俄语中的综合语言水平评估

TL;DR通过引入一个新的用于评估基础模型的多模态俄语架构(MERA),本文介绍了一种在零点和少点固定指令设置下评估基础模型和语言模型的方法论,该方法论可以扩展到其他模态,在评估开放式语言模型的基线时发现其仍远落后于人类水平。