Jun, 2024
BLEnD: 基于多元文化和语言的常识性 LLM 基准
BLEnD: A Benchmark for LLMs on Everyday Knowledge in Diverse Cultures and Languages
Junho Myung, Nayeon Lee, Yi Zhou, Jiho Jin, Rifki Afina Putri...
TL;DRLLMs 在文化敏感性方面缺乏对日常生活的文化特定知识,不同于在线来源如维基百科,BLEnD 通过手工设计的基准评估了 LLMs 对多元文化和语言的日常知识,结果显示 LLMs 在高度在线代表的文化中表现更好,而在低资源语言文化中表现更好的是英语而非本地语言。