Sep, 2023

基于大型语言模型的评估器能够解决多语种评估的扩展问题吗?

TL;DR通过对大型语言模型的评估,本文发现LLM-based evaluators在多语言评估方面可能存在偏差,并需要使用本地语言的数据集进行校准。