Oct, 2024

跨语言自动评估多语言大模型的评估

TL;DR本研究解决了现有自然语言处理评估方法主要集中于英语,而缺乏多语言评估框架的问题。提出的跨语言自动评估套件(CIA Suite)和评估模型Hercule,利用英语参考答案为低资源语言的文本生成赋分,实验结果显示其评估结果与人类判断高度一致,具有重要的多语言评估潜力和影响。