May, 2023

SeeGULL:一种利用生成模型实现广泛地域文化覆盖的刻板印象基准

TL;DR本研究旨在解决现有数据集只包含西方社会陈规模式以及规模和覆盖范围有限的问题,提出了一种使用大型语言模型 (PaLM 和 GPT-3) 和全球多元化评估来构建广泛覆盖的关于 178 个国家、8 个地缘政治地区以及 6 个大洲各个群体陈规的数据集 SeeGULL,并展示了该数据集的应用,包括陈规分析以及全球差异。