Jun, 2024
BLEnD: 基于多元文化和语言的常识性LLM基准
BLEnD: A Benchmark for LLMs on Everyday Knowledge in Diverse Cultures
and Languages
TL;DRLLMs在文化敏感性方面缺乏对日常生活的文化特定知识,不同于在线来源如维基百科,BLEnD通过手工设计的基准评估了LLMs对多元文化和语言的日常知识,结果显示LLMs在高度在线代表的文化中表现更好,而在低资源语言文化中表现更好的是英语而非本地语言。