Jun, 2024

BLEnD: 基于多元文化和语言的常识性 LLM 基准

TL;DRLLMs 在文化敏感性方面缺乏对日常生活的文化特定知识,不同于在线来源如维基百科,BLEnD 通过手工设计的基准评估了 LLMs 对多元文化和语言的日常知识,结果显示 LLMs 在高度在线代表的文化中表现更好,而在低资源语言文化中表现更好的是英语而非本地语言。