Mar, 2024

SeeGULL 多语言:一个地理文化背景下定位的刻板印象数据集

TL;DR使用 LLM 生成多种语言模型的方法,结合文化验证,建立全球规模的多语言社会刻板印象数据集,包含超过 20 种语言中的 25,000 个刻板印象,并且通过人工注释来显示其在模型评估中的差距。